В России создали метод распознавания плагиата в текстах на четырех языках
Разработка принадлежит ученым Новосибирского госуниверситета
НОВОСИБИРСК, 4 декабря./ТАСС/. Ученые Новосибирского госуниверситета (НГУ) разработали метод определения авторского стиля на основе математической статистики, который одинаково эффективен для четырех языков. Он может найти применение в оценке качества переводов и решении вопросов заимствований и плагиата, в том числе текстов, созданных нейросетями, сообщили ТАСС в пресс-службе вуза.
"Практически важная новая область - оценивание качества "машинного" или "компьютерного" перевода, осуществляемого разными программами. <...> Другая, более "прозаическая" область применения - определять части текста, написанного разными авторами, в том числе и фрагменты, написанные искусственным интеллектом. Эта задача особенно актуальна для университетов, а может, уже и школ, где довольно интенсивно ведется борьба с плагиатом в студенческих работах. Описанный метод может быть применен и для решения этой проблемы", - приводит пресс-служба слова автора разработки, профессора факультета информационных технологий вуза Бориса Рябко.
Ученый вместе с коллегами и учениками разработал количественный метод определения авторского стиля. Он основан на использовании аппарата математической статистики, что позволяет определять достоверность полученных выводов. Исследователи подобрали минимальный объем текста в килобайтах для определения авторского стиля сразу четырех языков: русского, английского, китайского и используемого в Эфиопии амхарского языка.
"Эти языки относятся к очень далеким друг от друга языковым группам, и даже сам вопрос о сравнении длины текста не так прост для них. Например, буквы в русском языке не сопоставимы с иероглифами в китайском, так как каждый иероглиф может переводиться на русский язык целым словом, а иногда и предложением. Отметим, что в рассматриваемой работе для всех языков объем текста оценивался в килобайтах, то есть в одних и тех же единицах", - приводит пресс-служба слова автора разработки.
Как пояснили в пресс-службе, предложенный метод может найти практическое применение в оценке качества различных переводов и квалификации переводчиков, а также может использоваться при решении вопросов, связанных с выявлением несанкционированных заимствований в текстах и других форм плагиата. "Говоря упрощенно, при этом подходе, перевод тем лучше, чем в большей степени он сохраняет авторский стиль, причем эту "степень сохранения" можно оценить количественно", - резюмировал профессор Рябко.