Международная группа учёных определила границы сжатия информации для языковых моделей

Учёные из AIRI, МФТИ и Лондонского математического института провели исследование. Исследователи выяснили, сколько информации может эффективно хранить и обрабатывать языковая модель. В работе использовался метод сжатия текста. Это позволило измерить пределы ёмкости модели. Исследователи доказали: текст длиной 1,5 тысяч слов можно представить одним вектором. Вектор — это набор чисел, понятный модели. Он позволяет восстановить исходный текст. Об этом информационной службе Хабра рассказали…

LLM работают лучше если им угрожать? Вообще не факт

Окей, недавно Сергей Брин (кофаундер Google) брякнул, мол, «Все LLM модели работают лучше, если им угрожать». Только ленивый не перепечатал это в СМИ и соцсетях. Вот видос с таймкодом: Когда-то я верил в такие утверждения и думал «Вау, этот AI такой же как мы, это так философско и глубоко». А потом я занялся изучением LLM-технологий и два года проработал AI solutions architect.…