Google тестирует функцию поиска в PDF-файлах и на изображениях

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Google тестирует функцию Smart Search, которая позволяет упростить поиск информации в PDF-файлах и на изображениях. Опция использует возможности локального машинного обучения для улучшения поиска в файлах. В описании Smart Search указано, что функция позволяет добиться лучших результатов поиска за счёт автоматического сканирования содержимого файлов на устройстве.

Smart Search способен найти текст на изображениях и в PDF-файлах, местоположение и объекты на фотографиях, а также исполнителя, альбом и название композиции из аудио- и видеозаписей.

Фактически функция может сделать проводник на устройстве более полезным, чем многие файловые браузеры в настольных операционных системах.

Пример запроса для поиска по слогану IKEA
Пример запроса для поиска по слогану IKEA

Распознавание текста работает надёжно, когда PDF-файлы и изображения уже какое-то время находятся на устройстве. Поиск можно осуществить по ключевым словам. Способ применителен к фотографиям и скриншотам с текстом, что значительно сокращает количество необходимых действий для поиска старых файлов.

Результат поиска
Результат поиска

На изображениях также можно искать объекты. Например, поиск можно выполнить по слову «кошки», чтобы найти все изображения с котами. Однако автор портала Android Police отмечает, что эта функция Smart Search работает не так хорошо, как Google Photos, который способен находить друзей и родственников по именам, если пользователь сохранил их в сервисе.

Google пишет, что Smart Search сканирует файлы в фоновом режиме с учётом производительности и конфиденциальности устройства. Функция работает автономно, поэтому данные пользователей не покидают устройство. Опцию умного поиска можно отключить в настройках приложения.

Источник: https://habr.com/ru/news/779320/


Интересные статьи

Интересные статьи

Фирменный чат-бот Bard от Google теперь работает на базе модели машинного обучения Gemini Pro. В компании рассказали, что это улучшает его возможности во всех задачах, а пользователи отмечают, что пер...
Большая часть информации в мире хранится в виде таблиц, которые можно найти в Интернете или в базах данных и документах. В таблицах может находиться всё что угодно, от технических характеристик потреб...
Вы можете встретить компонент пользовательского интерфейса, у которого есть текст над изображением. В некоторых случаях в зависимости от используемого изображения текст б...
Примечание от переводчика: этот текст — перевод-компиляция двух небольших англоязычных заметок, которые автор почему-то разделил на два разных текста. Я уверен, что логически они связаны и предст...
TL;DR Недавние изменения в модели ценообразования, мягко говоря, безумны. Когда я в 2012 году запустил NUKEMAP, у Google Maps были просто потрясающие программные интерфейсы. Абсолютно лучшие ...