Машинное обучение улучшило "Яндекс"
Машинное обучение улучшило "Яндекс"
Автор: Андрей Письменный
Опубликовано 06 апреля 2010 года
"В прошлом году у нас произошёл сильный прорыв в качестве поиска", - сообщил генеральный директор компании "Яндекс" Аркадий Волож на недавней пресс-конференции, посвящённой технологии MatrixNet. Новый алгоритм ранжирования помогает "Яндексу" выдавать более точные результаты в ответ на поисковые запросы. Его позитивное влияние отразилось и на популярности поисковика.
Новая технология работает в последней версии поисковика, носящей кодовое название "Снежинск", с ноября 2009 года. "Если версия улучшает качество на 1%, она выкладывается в продакшн. Большие релизы с названиями - это 1-2 процента качества. А со "Снежинском" нам удалось выиграть пять процентов," - говорит Волож. По его словам, успех "Матрикснета" настолько заметен, что им заинтересовались другие крупные поисковики (Волож дипломатично назвал их "конкурирующими компаниями из Калифорнии").
Необычность "Матрикснета" заключается в том, что алгоритм при оценке страницы учитывает не десятки или сотни факторов, а чуть ли не тысячи. Причём он устойчив к "переобучаемости" (то есть менее склонен случайно принимать за важные параметры что-нибудь явно бессмысленное, чем предшественники) и достаточно быстр.
Собственно говоря, в скорости работы и кроется главное преимущество "Матрикснета". Сравнимые по другим показателям методы машинного обучения существовали и раньше, но из-за недостаточной скорости они не годились для поисковой машины. В "Яндексе" придумали, как оптимизировать алгоритм.
Объяснить принцип работы "Матрикснета" простыми словами не так легко. Сотрудники "Яндекса" хоть и берутся это делать, но в результате примеры оказываются расплывчатыми. Видимо, математика, использующаяся в машинном обучении, плохо приспособлена для изложения на примерах с яблоками. Но в целом преимущество нового алгоритма кажется вполне понятным: чем длиннее и сложнее формула ранжирования, тем точнее поиск. "Матрикснет" умеет оперировать десятками тысяч коэффициентов.
"Матрикснет" решает и ещё одну проблему, стоящую перед создателями поисковиков. Обычно любое изменение в алгоритме влияет на все результаты. "Матрикснет" же можно настраивать по-разному для разных групп запросов.
"Представьте, что у нас есть телескоп, мощность которого выросла в десять раз - объясняет Волож. - Что с ним делать? Можно получать результаты там, где не хватало точности измерения. К примеру, по редким запросам". Раньше поисковик мог формировать уникальную выдачу для жителей разных регионов, а теперь при ранжировании результатов может учесть, что пользователь живёт в конкретном городе.
По словам Воложа, улучшение результатов заметно не только по метрикам, но и напрямую влияет на посещаемость. Последние полтора года доля "Яндекса" неумолимо снижалась, достигнув 60 процентов в позапрошлом году. С появлением "Матрикснета" она снова пустилась в рост и уже достигла 62 процентов.
Примечательно, что придумана новая технология была в одночасье: "главный прорыв был сделан за 10 минут в конце 2008 года" – рассказывает Волож. Остальное время было потрачено на доработку "Матрикснета".
Новым алгоритмом, естественно, сразу же заинтересовались поисковые оптимизаторы – каждая новая версия поисковика всегда приводит к большой шумихе в их кругах. Оно и понятно – выведенные на верхние места результаты начинают внезапно менять позиции, "купленные" ссылки перестают работать, и приходится в срочном порядке искать новые трюки.
Оптимизаторы скрупулёзно изучают новый алгоритм, пытаясь найти закономерности его работы, чтобы затем их эксплуатировать. SEO отмечают, что "Матрикснет" куда благосклоннее к старым сайтам чем к новым, то же самое относится и к ссылкам – старые ссылки ценятся больше новых.
Сайт anokalintik.ru, к примеру, призывает оптимизаторов ответственнее относиться к подготовке содержимого сайта. Прислушайся SEO к такому мнению, можно было бы говорить об особенной пользе "Матрикснета". Многие, впрочем, по-прежнему заняты своими делами: прикидывают формулы ранжирования или ругают новые правила геотаргетинга ("Снежинск" чаще показывает в регионах столичные результаты чем это делала прошлая версия).
Улучшение качества поиска, благоприятное влияние на оптимизаторов, повышение посещаемости – казалось бы, что может быть лучше? Опасаться можно лишь конкурентов – Аркадий Волож не отрицает, что и они вскоре введут похожие алгоритмы. Но как бы серьёзно ни были настроены конкурирующие поисковики, "Яндекс" так просто не напугать. Мантра технического директора компании Ильи Сегаловича "пока работаем, мы непобедимы" тут как нельзя более к месту.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Обучение детей Александра III
Обучение детей Александра III Когда у Александра III появилась семья и дети, то для подросших детей были воспроизведены все сложившиеся со времен Николая I образовательно-воспитательные традиции. Однако об образовании Николая II сведений дошло очень мало. Известно, что
Обучение детей Николая II
Обучение детей Николая II Сведений об организации учебного процесса дочерей Николая II сохранилось немного. Фактически это отрывочные данные, из них с трудом можно составить цельную картину. Вместе с тем хорошо известна организация учебы цесаревича Алексея. Поэтому с
Глава 10 Воспитание и обучение самурая
Глава 10 Воспитание и обучение самурая В воспитании рыцаря-самурая главной целью было выковать характер, причем отодвигались на второй план более утонченные способности, такие как рассудительность, ум и искусство спора. Мы уже видели, какую важную роль играли в
Обучение языкам-посредникам других животных
Обучение языкам-посредникам других животных О чем говорят «говорящие» птицы Накопление данных об употреблении языков-посредников шимпанзе и гориллами способствовало новой вспышке интереса к феномену «говорящих» птиц. Они, в отличие от обезьян и дельфинов, весьма
Андрей Плахов ("Яндекс") о поисковой технологии "Спектр"
Андрей Плахов ("Яндекс") о поисковой технологии "Спектр" Автор: Юрий ИльинОпубликовано 07 октября 2011 года- Расскажите, пожалуйста, как появилась технология "Спектр" и для чего предназначена? На кого в первую очередь ориентирована?- Как появилась? Мы в какой-то момент заметили,
Глава 5 Обучение: только для мальчиков, у девочек нет в этом нужды
Глава 5 Обучение: только для мальчиков, у девочек нет в этом нужды Я родилась девочкой в бедной тайской семье. Как большинство бедных девочек, я ходила в школу только до 12 лет, или до 6 класса. Денег в семье было достаточно только для обучения моего брата. «Обучение только для
Обучение прекрасному
Обучение прекрасному В быту японцев прочно укоренились обычаи коллективного любования наиболее поэтическими явлениями природы. Зимой принято наслаждаться свежевыпавшим снегом, весной – цветением вишни, осенью – багряной листвой кленов и полной луной.Речь идет не о
Обучение альтруизму
Обучение альтруизму Экман: Третий вопрос касается того, что мы можем сделать, чтобы разработать программу исследования сострадания и обучения состраданию. Потому что это жизненно важно. Возможно, это самая важная задача. С помощью каких практик вы вырабатываете
Начинаем обучение
Начинаем обучение Вне зависимости от того, есть среди вас человек с медицинским образованием или нет, рекомендую всем взрослым обитателям убежища посетить как можно больше медицинских курсов. Начните с основ, которые предлагают организации Красного Креста, и продолжите
9. Военное обучение и политико-воспитательная работа
9. Военное обучение и политико-воспитательная работа Военное обучение солдата-освободителя – это сама жизнь партизанского отряда. Насколько трудно научить бойцов владеть оружием, известно каждому командиру.Командир и бойцы живут под одной крышей. Бойцы должны перенять
Глава 3. Подготовка и обучение
Глава 3. Подготовка и обучение Профессиональная подготовка офицеров в России в специальных учебных заведениях началась при создании регулярной армии, но первоначально она касалась только специальных родов войск. Учебные заведения по подготовке общевойсковых офицеров
Обучение
Обучение Формирование дивизии началось 17 июля 1943 года, когда первый эшелон с рекрутами численностью 740 человек прибыл в Брюнн (Брно). Здесь новобранцам выдали униформу, снаряжение и ознакомили с учебной программой. 740 человек распределили по трем ротам. 500 человек