МОСКВА, 9 сентября. /ТАСС/. Российские ученые выяснили, что точность работы систем ИИ для подготовки пользовательских рекомендаций можно в среднем повысить примерно на 7%, если применить скорректированный ими метод обучения нейросетей, позволяющий экономить ресурсы без ущерба для качества работы системы. Об этом сообщила пресс-служба Яндекса.
"Внутреннее тестирование показало, что новый подход позволяет повысить точность рекомендаций моделей в среднем на 7% по показателям качества ранжирования. Яндекс планирует использовать метод при обучении рекомендательных моделей собственных сервисов, а также метод будет полезен и другим компаниям и независимым разработчикам, работающим с рекомендательными системами", - говорится в сообщении.
Как отмечают авторы нового подхода для обучения рекомендательных систем ИИ, для ускорения их обучения и разработки часто применяется алгоритм выборочного сэмплирования, при использовании которого инженеры подготавливают два набора примеров положительного и отрицательного поведения пользователей для обучения ИИ. Роль первого могут играть те товары или медиаресурсы, которые пользователь добавил в корзину или отметил лайком, тогда как не вызывающие интереса страницы и товары становятся отрицательными примерами.
Метод выборочного сэмплирования позволяет заметно уменьшить число негативных примеров, необходимых для обучения ИИ, однако у него есть несколько недостатков. В частности, он далеко не всегда корректно учитывает влияние популярности того или иного товара на частоту его попадания в набор позитивных или негативных примеров, с чем разработчики ИИ пытаются бороться, используя специальные корректировочные формулы.
Российские ученые обнаружили, что одна из популярных формул такого рода, LogQ, не учитывала различий между позитивными и негативными примерами и предполагала, что они выбираются из наборов данных случайным образом, что на самом деле не так. Исследователи учли это и скорректировали LogQ таким образом, чтобы она корректно применялась к разным типам примеров в процессе обучения системы ИИ.
Последующие проверки на популярных наборах данных показали, что новый подход позволяет в среднем на 7% повысить качество рекомендаций, подготовленных ИИ, что является очень существенным улучшением для данной отрасли IT-технологий. В перспективе, это позволит значительным образом улучшить работу видеохостингов, торговых онлайн-площадок и прочих порталов, где пользователи часто пользуются рекомендациями по подборке товаров или медиаконтента.