|
|
 |
Цены на оптимизацию и раскрутку |
 |
 |
|
Арзамас (Анадырь): Снятие омонимии
Ведущая поисковая система в Интернете может более избирательно оценивать значения слов в запросах. Речь идёт об омонимах, словах имеющих одинаковое звучание, но разное значение. Что называется, Яндекс стал ещё лучше понимать русский язык. Когда в запросе указано [реконструкция Маяковский] поисковая система покажет и такую страницу – [станция Маяковская открылась после реконструкции].
Однако русский язык не зря считается одним из сложных и неоднозначных. До сих пор поисковики на запрос [фото львов] – выдавали как фотографии животных, так и фотографии с видами города Львова. В общении человека с человеком можно уточнить свой вопрос, добавив к нему уточняющее слово: [фото африканских львов] или [фото города Львова]. Такого рода уточнения поисковая система Яндекс научилась понимать.
В механизм поиска заложен алгоритм снятия омонимии, который позволяет, в большинстве случаев, определить какое конкретно значение имеется в виду. В результате выдаются только документы с нужным смыслом слова. Если запрос звучит [фото африканских львов], то его результат будет содержать слова «лев», «льва», «льву». Но в нём не будут содержаться документы со словами «Львова» и «Львову».
Алгоритм снятия омонима учитывает частоту слов и их сочетаний, употребляемых в Интернете, а также на анализ запросов пользователей. Плюс к этому он использует лексическую статистику слов из Национального корпуса русского языка. Национальный корпус русского языка – это академический проект, в котором активно участвует Яндекс. При анализе неоднозначного запроса выбирается наиболее часто употребляемая модель. Выбор по такому принципу помогает понять, что «день рыбака» это праздник, а не лозунг. Точно так же как «платья придворных дам» не обещания раздачи одежды. Однако всегда найдутся вопросы, на которые будет даваться два ответа: «Сколько голов у Павлюченко?»
|
|
|
 |
|
 |
|
|