Introducción a Amar Oitijjho
La frase bengalí 'Amar Oitijjho' se puede traducir como 'mi herencia'. Hemos empleado intencionalmente el pronombre 'mi' para enfatizar el apego individual, la participación y la adaptación personal de una herencia cultural común, al mismo tiempo que subrayamos que esta herencia pertenece a la comunidad en general. En un mundo globalizado donde estamos continuamente abrumados por las influencias de diversas culturas, es esencial que nos enorgullezcamos y desarrollemos un apego íntimo a los elementos culturales que nos distinguen y definen nuestra identidad.
Este proyecto tiene como objetivo desarrollar una aplicación para teléfonos inteligentes Android que pueda reconocer fotos de billetes de Taka y mostrar un modelo 3D correspondiente en la pantalla del móvil utilizando la realidad aumentada. El resultado esperado es que el modelo 3D se puede colocar en cualquier superficie plana para brindar una apariencia realista. La aplicación se puede resumir en tres etapas: crear un modelo de IA, crear un punto final para recibir información relevante sobre una imagen que se captura y finalmente conectar el resultado de la segunda sección a un motor de realidad aumentada (ARCore) para mostrar el modelo 3D en pantallas de móviles. La primera fase de desarrollo consiste en recopilar imágenes del mundo real de billetes de banco que el sistema inteligente utilizará para identificarlos. A través de la recopilación de información, se debe compilar una biblioteca de imágenes completa, que incluya fotografías de billetes de 10, 20 y 100 taka capturadas desde diferentes ángulos de cámara y bajo diferentes circunstancias de iluminación. Se pueden agregar más fotos en cualquier momento y el modelo de IA se puede volver a entrenar varias veces para mejorar la precisión general. El conjunto de datos de imágenes se utilizará para entrenar y evaluar el modelo inteligente. Red neuronal convolucional, que tiene un excelente historial de reconocimiento de imágenes, podría ser una opción aceptable para este propósito. Una vez que se ha construido el modelo, podemos pasar a la segunda etapa, que consiste en establecer un diccionario para etiquetar las fotos con los nombres requeridos para que el sistema de IA pueda reconocer una imagen y entregar un resultado que indique qué imagen ha detectado. Los datos proporcionados por el diccionario se transferirán luego al marco de realidad aumentada desarrollado para mostrar el modelo 3D requerido.
Este proyecto tiene como objetivo desarrollar una aplicación para teléfonos inteligentes Android que pueda reconocer fotos de billetes de Taka y mostrar un modelo 3D correspondiente en la pantalla del móvil utilizando la realidad aumentada. El resultado esperado es que el modelo 3D se puede colocar en cualquier superficie plana para brindar una apariencia realista. La aplicación se puede resumir en tres etapas: crear un modelo de IA, crear un punto final para recibir información relevante sobre una imagen que se captura y finalmente conectar el resultado de la segunda sección a un motor de realidad aumentada (ARCore) para mostrar el modelo 3D en pantallas de móviles. La primera fase de desarrollo consiste en recopilar imágenes del mundo real de billetes de banco que el sistema inteligente utilizará para identificarlos. A través de la recopilación de información, se debe compilar una biblioteca de imágenes completa, que incluya fotografías de billetes de 10, 20 y 100 taka capturadas desde diferentes ángulos de cámara y bajo diferentes circunstancias de iluminación. Se pueden agregar más fotos en cualquier momento y el modelo de IA se puede volver a entrenar varias veces para mejorar la precisión general. El conjunto de datos de imágenes se utilizará para entrenar y evaluar el modelo inteligente. Red neuronal convolucional, que tiene un excelente historial de reconocimiento de imágenes, podría ser una opción aceptable para este propósito. Una vez que se ha construido el modelo, podemos pasar a la segunda etapa, que consiste en establecer un diccionario para etiquetar las fotos con los nombres requeridos para que el sistema de IA pueda reconocer una imagen y entregar un resultado que indique qué imagen ha detectado. Los datos proporcionados por el diccionario se transferirán luego al marco de realidad aumentada desarrollado para mostrar el modelo 3D requerido.
Más detalles