4

We use cookies. Read the Privacy and Cookie Policy

4

Между прочим, даже для повторения рассказанного найдутся уловки. Именно машины, сортирующие (например) научные статьи, запрограммированы таким образом, чтобы различать тексты в соответствии со «словами-ключами». Если частота появления таких слов, как «плазма крови», «гемофилия» или «клеточная оболочка», перешагнет определенный порог, значит, текст, вероятнее всего, относится к области медицины или (шире) биологии. Если в нем появляются «кварки» или «нуклиды» — понятно, куда его отнести. Однако поступая этим первоначально очень примитивным и «ничего не понимающим» способом, можно научить машину пересказывать так, чтобы повторение представленного ей текста было «скелетным» — грамматически, лексикографически и стилистически очень близким к рассказанному, но чтобы оно не совпадало дословно с исходным. То есть можно сделать машину удачным «обманщиком», выдающим себя за живого участника дискуссии, и на этом этапе появляется следующая проблема.