Коментар | Кой шепне в ухото на вашия чатбот

Третият слой е уеб търсенето. Когато чатботовете търсят онлайн или достъпват дигитални бази данни, т.нар. RAG (Retrieval-Augmented Generation) системи определят кои части от информацията да бъдат включени в отговора на модела. Тази функция е сходна на тези на традиционните търсачки, които приоритизират определени източници пред други. И както при търсачките, въвеждането на реклами в отговорите на чатботовете – което ChatGPT стартира през 2026 г. – ще повдигне допълнителни въпроси относно обективността.

Четвъртият слой включва системните промптове (system prompts). Тъй като се задействат, когато чатботът генерира отговор, те позволяват на платформите да променят поведението му без повторно обучение. Например след като системният промпт на Grok беше публикуван миналата година, сега знаем, че той включва инструкции като „не се въздържай от твърдения, които са политически некоректни“ (ChatGPT, Claude и Gemini също използват системни промптове, но те остават тайна).

Последният слой са филтрите за безопасност. Преди заявката към чатбота да достигне до модела, входни филтри определят дали тя е „приемлива“. По подобен начин, след като моделът генерира отговор, изходни филтри могат да модифицират, цензурират или „изчистят“ съдържанието, преди да го видите. Въпреки че платформите имат основателни причини да блокират определени заявки (например такива, които търсят инструкции за правене на бомба), липсата на прозрачност около филтрите оставя отворени въпроси. Разработчиците на модели могат да създадат систематична цензура и ние не бихме разбрали. „Филтрите за безопасност“ на китайските чатботове цензурират всички препратки към клането на площад „Тянанмън“.

Докато чатботовете се внедряват в глобален мащаб, политически и корпоративни интереси вече оформят споменатото струпване на алгоритмично влияние. След като Доналд Тръмп бе назначен повторно на власт, Apple актуализира инструкциите за обучение на своя AI, за да не определя на поддръжниците на MAGA като „радикални“ или „екстремни“. Миналото лято Reuters установи, че Meta е актуализирала вътрешните си AI насоки, разхлабвайки механизмите, които не позволяват на чатботовете й да правят расистки изказвания или да „флиртуват“ с непълнолетни наред с други неща. През май миналата година Grok започна да усилва непотвърдени и извадени от контекст твърдения за „геноцид срещу бели“ в Южна Африка (самият Мъск е бял южноафриканец). Компанията твърди, че проблемът е дошъл от „неоторизирани модификации“, но подобни „бъгове“ са чести и всичките изглеждат идеологически съвместими с възгледите на самия Мъск.

Сподели тази новина