Dahua AI Technology es número 1 en la evaluación de la segmentación semántica KITTI

Loading

Dahua Technology ha establecido centros de computación y datos a gran escala para la capacitación de algoritmos, centrándose en la investigación y comercialización de dominios de algoritmos múltiples, y ha formado su principal competitividad. En el 2017, obtuvo el primer lugar en el campo de flujo de escena, flujo óptico y detección de reconocimiento de texto. En el 2018 ganó el primer lugar en la Evaluación de detección de objetos de vehículos en 2D, el Seguimiento de MOT y la Re-identificación de peatones. A inicios del 2019, ganó el primer lugar en la competencia internacional de Case Segmentation Evaluation. Esta vez en el campo del Algoritmo de Segmentación Semántica, Dahua Technology  hizo nuevos avances una vez más.

Acerca de KITTI

Establecido por el Instituto de Tecnología de Karlsruhe y el Instituto Tecnológico de Toyota en Chicago, el conjunto de datos KITTI es uno de los más grandes conjuntos de referencia de algoritmos  internacionales de visión por ordenadores más grandes. Los conjuntos de datos se utilizan para evaluar el rendimiento de estéreo, flujo óptico, odometría visual, detección y rastreo de objetos, carreteras, semánticas y otras tecnologías de visión en el entorno del vehículo.

KITTI contiene imágenes reales recopiladas de una variedad de escenas, como áreas urbanas, áreas rurales, carreteras, etc. Cada imagen contiene hasta 15 vehículos y 30 peatones con diversos grados de oclusión y truncamiento.

Segmentación semántica

La segmentación semántica se refiere al proceso de clasificar cada píxel de la imagen de entrada de una computadora en la categoría de objeto. No es solo la tarea básica de la visión por ordenador, sino que también desempeña un papel vital en la aplicación de la conducción autónoma, la comprensión de la escena de robots y la realidad virtual.

En la tarea de segmentación semántica KITT 19 tipos de objetos como automóviles, peatones, carreteras, motocicletas, bicicletas, señales de tráfico, edificios y vegetación en varias escenas deben segmentarse con precisión. Al mismo tiempo, el conjunto de capacitación proporciona solo 200 datos, que es una pequeña muestra de aprendizaje.

En esta evaluación Dahua Technology incorporó las ventajas de la clasificación de imágenes, la segmentación de un solo objetivo, la segmentación semántica de píxeles completos y otros algoritmos avanzados para mejorar la precisión de la segmentación semántica, y construyó un mecanismo de atención global basado en múltiples posiciones y características del medio. Además, el aprendizaje de la migración y los métodos de aprendizaje incremental también se adoptaron para mejorar efectivamente la precisión de segmentación del algoritmo.

Digiqole Ad
...

Notas Relacionadas

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *