Современные приложения для распознавания изображений помогают пользователям получать быстрые и точные ответы, когда нужен второй взгляд на предмет или текст. В этом обзоре я протестировал две популярные системы — ChatGPT Vision и Google Lens — и провёл серию из семи запросов, чтобы определить, какое из решений показывает лучшие результаты.
Преимущества и особенности
ChatGPT Vision интегрируется с мощной языковой моделью GPT, что позволяет ему не только распознать изображение, но и дать развернутый ответ, основываясь на контексте. В свою очередь, Google Lens отлично справляется с идентификацией объектов, текста и даже местоположения, предлагая быстрые и точные данные.
Тестовые запросы и результаты
За время эксперимента я использовал семь различных запросов, включая распознавание текста, определение предметов и поиск информации по изображению. В большинстве случаев Google Lens показал отличную точность и скорость, особенно в распознавании визуальных элементов.
- Как современные домашние индюки отличаются от своих диких предков
- Частная лунная посадочная станция Blue Ghost успешно приземлилась на Луну с оборудованием для NASA
- П Pete Davidson и Casey Affleck в новом триллере о тайнах Биткоина от режиссера Дуга Лаймана
- Судья раскритиковал прокуроров DOJ и отказался возбуждать дело против Трампа
Победитель по итогам теста
Однако, при определённых сценариях ChatGPT Vision давал более развернутые и содержательные ответы, что делает его более универсальным инструментом. В итоге, один из вариантов явно выделился как лучший в зависимости от типа задачи.