Декабрь 18, 2004
Яндекс индексирует XLS и PPT
Яндекс научился индексировать электронные таблицы в формате Microsoft Excel и презентации в формате Microsoft PowerPoint. Уже сейчас в базе Яндекса около 50 тысяч электронных таблиц и более 2,5 тысяч презентаций. В результатах поиска такие документы перед заголовком имеют пометку «(xls)» и «(ppt)» соответственно. По ссылке «Сохраненная копия» можно посмотреть текстовое представление документа.
«Excel — один из самых распространенных форматов, в котором пользователи сохраняют табличную информацию — например, прайс-листы и расписания рейсов, итоги выборов и результаты спортивных соревнований, — говорит Александр Садовский, менеджер поисковых проектов. — PowerPoint, несмотря на небольшое, по сравнению с объемом базы Яндекса, количество документов, часто содержит уникальную информацию: научные и деловые презентации к докладам, которые нельзя найти ни в каком другом виде. Теперь вы сможете легко выбрать прищепки для белья или или узнать, что будет происходить в 2020 году».
Возможность индексировать электронные таблицы и презентации не менее важна для программы локального поиска — Яндекс.Сервера.
Кроме стандартного HTML, Яндекс понимает такие форматы, как PDF, DOC, RTF, Flash, а теперь и XLS с PPT. Задавая запрос со страницы расширенного поиска, можно ограничить поиск только документами нужного формата.