Создан алгоритм, который на 7% повысил качество обучения рекомендательных систем ИИ

Как отмечают авторы нового подхода для обучения рекомендательных систем искусственного интеллекта, для ускорения их обучения и разработки часто применяется алгоритм выборочного сэмплирования,

МОСКВА, 9 сентября. /ТАСС/. Российские ученые выяснили, что точность работы систем ИИ для подготовки пользовательских рекомендаций можно в среднем повысить примерно на 7%, если применить скорректированный ими метод обучения нейросетей, позволяющий экономить ресурсы без ущерба для качества работы системы. Об этом сообщила пресс-служба Яндекса.

"Внутреннее тестирование показало, что новый подход позволяет повысить точность рекомендаций моделей в среднем на 7% по показателям качества ранжирования. Яндекс планирует использовать метод при обучении рекомендательных моделей собственных сервисов, а также метод будет полезен и другим компаниям и независимым разработчикам, работающим с рекомендательными системами", - говорится в сообщении.

Как отмечают авторы нового подхода для обучения рекомендательных систем ИИ, для ускорения их обучения и разработки часто применяется алгоритм выборочного сэмплирования, при использовании которого инженеры подготавливают два набора примеров положительного и отрицательного поведения пользователей для обучения ИИ. Роль первого могут играть те товары или медиаресурсы, которые пользователь добавил в корзину или отметил лайком, тогда как не вызывающие интереса страницы и товары становятся отрицательными примерами.

Метод выборочного сэмплирования позволяет заметно уменьшить число негативных примеров, необходимых для обучения ИИ, однако у него есть несколько недостатков. В частности, он далеко не всегда корректно учитывает влияние популярности того или иного товара на частоту его попадания в набор позитивных или негативных примеров, с чем разработчики ИИ пытаются бороться, используя специальные корректировочные формулы.

Российские ученые обнаружили, что одна из популярных формул такого рода, LogQ, не учитывала различий между позитивными и негативными примерами и предполагала, что они выбираются из наборов данных случайным образом, что на самом деле не так. Исследователи учли это и скорректировали LogQ таким образом, чтобы она корректно применялась к разным типам примеров в процессе обучения системы ИИ.

Последующие проверки на популярных наборах данных показали, что новый подход позволяет в среднем на 7% повысить качество рекомендаций, подготовленных ИИ, что является очень существенным улучшением для данной отрасли IT-технологий. В перспективе, это позволит значительным образом улучшить работу видеохостингов, торговых онлайн-площадок и прочих порталов, где пользователи часто пользуются рекомендациями по подборке товаров или медиаконтента.

Теги

Россия

Конгресс молодых ученых

В Сириусе откроется V Конгресс молодых ученых

В нем примут участие более 7 тыс. человек из России и примерно 70 стран мира

Читать полностью