Dahua AI Technology ocupa el primer puesto en la evaluación de la segmentación semántica KITTI

Este reconocimiento sitúa al fabricante como el mejor de la industria con su algoritmo de segmentación semántica DH-MDS. Esta tecnología permite clasificar cada píxel de una imagen en la categoría de objeto.

Dahua Technology ha establecido centros de computación y de datos a gran escala para la mejora de algoritmos, allí se ha centrado en la investigación y comercialización de dominios de algoritmos múltiples y ha estructurado uno de sus  principales elementos de competitividad en el mercado.

En 2017 Dahua Technology obtuvo el primer lugar en el campo de flujo de escena, flujo óptico y detección de reconocimiento de texto respectivamente.

En 2018, obtuvo el primer lugar en la evaluación de detección de objetos de vehículos en 2D, el Seguimiento de MOT y la re-identificación de peatones.

A principios de 2019 Dahua obtuvo el primer lugar en la competencia internacional de Case Segmentation Evaluation, esta vez en el campo del algoritmo de segmentación semántica de imagen y rompió el récord mundial por su algoritmo de aprendizaje, superando a otras compañías de inteligencia artificial de primera categoría y a instituciones académicas de investigación líderes, lo que sustenta la posición de liderazgo del fabricante en el campo de la segmentación semántica. 

La segmentación semántica se refiere al proceso de clasificar cada píxel de la imagen de entrada de una computadora en la categoría de objeto.

No es solo la tarea básica de la visión por ordenador, sino que también desempeña un papel vital en la aplicación de la conducción autónoma, la comprensión de la escena de robots y la realidad virtual.

Dahu Conjunto de datos Kitti

Establecido por el Instituto de Tecnología de Karlsruhe y el Instituto Tecnológico de Toyota en Chicago, KITTI es uno de los conjuntos de datos referencia para algoritmos internacionales de visión por computadora más grandes. Los conjuntos de datos se utilizan para evaluar el rendimiento estéreo, flujo óptico, edometría visual, detección y rastreo de objetos, carreteras y otras tecnologías de visión.

KITTI contiene imágenes reales recopiladas de una variedad de escenas, como áreas urbanas, áreas rurales, carreteras, etc. Cada imagen contiene hasta 15 vehículos y 30 peatones, con diversos grados de oclusión y truncamiento.

En la tarea de segmentación semántica KITTI, se emplearon 19 tipos de objetos como automóviles, peatones, carreteras, motocicletas, bicicletas, señales de tráfico, edificios y vegetación en varias escenas y la tarea del fabricante consistió en segmentar con precisión cada objeto.

Al mismo tiempo, el conjunto de capacitación proporciona solo 200 datos, lo que se traduce como una pequeña muestra con la cual la tecnología de cada modelo debe realizar el aprendizaje computacional.

En esta evaluación, Dahua Technology incorporó las ventajas de la clasificación de imágenes, la segmentación de un solo objetivo, la segmentación semántica de píxeles completos y otros algoritmos avanzados para mejorar la precisión.

Con esto construyó un mecanismo de atención global basado en múltiples posiciones. Además, desarrolló una técnica que permitió mejorar efectivamente la precisión de segmentación del algoritmo, lo que se traduce en entender con mayor tasa de éxito los objetos en la imagen y evitar falsos positivos.

Compartir

Share on facebook
Facebook
Share on google
Google+
Share on twitter
Twitter
Share on whatsapp
WhatsApp
Share on email
Email
Share on print
Print
Cerrar menú
×

Carrito