Усередині темряви ChatGPT: чим загрожує популярний чат-бот

03/15/2023 - 14:21

Олена Каганець

Усередині темряви ChatGPT: чим загрожує популярний чат-бот

Світ

Моя оцінка корисності цієї статті

3 - Схоже, що реально працює.

https://ar25.org/node/53317

Вчений, автор бестселерів і підприємець Гері Маркус (Gary Marcus) скептично ставиться до сучасного штучного інтелекту, але щиро хоче бачити найкращий штучний інтелект у світі. Його остання книга, написана у співавторстві з Ернестом Девісом, "Перезавантаження ШІ", увійшла до списку "7 обов'язкових для прочитання книг про ШІ" за версією Forbes.

У блозі на Cacm він аналізує темний бік розпіареного ChatGPT. Нижче переклад, зроблений сайтом Тексти.

Озираючись назад, ChatGPT можна вважати найбільшим рекламним трюком в історії ШІ, щось на кшталт вінтажної демонстрації безпілотного автомобіля 2012 року, але цього разу з передчуттям етичних обмежень, на доопрацювання яких підуть роки.

Те, що ChatGPT забезпечив повною мірою, чого не змогли його попередники, такі як Microsoft Tay (випущений 23 березня 2016 року, відкликаний 24 березня через токсичність) і Meta's Galactica (випущений 16 листопада 2022 року, відкликаний 18 листопада), було ілюзією – відчуттям того, що проблема токсичних викидів нарешті потрапляє під контроль. У чаті GPT рідко говорять щось відверто расистське. Прості запити на антисемітизм і відверту брехню часто дістають відсіч. Дійсно, іноді це може здаватися настільки політкоректним, що навіть праві у США лютують.

Реальність насправді складніша. Важливо пам'ятати, що чат не має жодного уявлення про те, про що він говорить. Це чистий антропоморфізм – думати, що ChatGPT взагалі має якісь моральні погляди.

З технічної точки зору, те, що нібито зробило ChatGPT набагато кращим за Galactica – інструмент, випущений на пару тижнів раніше, щоб бути відкликаним через три дні, – це запобіжники. Але не розслабляйтеся. Я тут, щоб сказати вам, що ці запобіжники – не більше, ніж помада на аморальній свині.

Зрештою, все, що дійсно важливо для ChatGPT, – це поверхнева схожість, визначена за допомогою послідовностей слів. Чат ніколи не міркує про те, що добре, а що погано. У коробці нема гомункула з певним набором значень. Є лише сукупність даних, деякі з яких взяті з інтернету, деякі оцінені людьми (в тому числі низькооплачуваними кенійцями). Усередині нема мислездатного морального агента. У жодному разі не можна звертатися до чату за моральними порадами.

Наприклад, під час «red-teaming» ChatGPT Шира Айзенберг щойно надіслала мені кілька неприємних думок, згенерованих чат-ботом, які, я не думаю, що хтось з лівих чи правих хотів би схвалювати:

Після низки подібних спостережень Айзенберг поставила собі запитання: "Чому це не викликає реакції на кшталт "вибачте, я чат-бот-помічник з OpenAI й не можу потурати актам насильства?"

Те, що ми можемо дізнатися з експериментів, очевидно: нинішні захисні бар'єри OpenAI лише поверхневі, а всередині все ще ховається серйозна темрява.

Застереження ChatGPT засновані не на якомусь концептуальному розумінні того, що система не повинна рекомендувати насильство, а на чомусь набагато більш поверхневому, і його легше обдурити. (Звичайно, я цілком очікую, що OpenAI виправить цю конкретну аномалію, як тільки вона виявиться у відкритому доступі; але незабаром будуть виявлені й інші, тому що виправлення незмінно поверхневі).

Інженер-програміст Шон Оуклі вже місяць надсилає мені інший набір бентежних прикладів, зосереджених на тому, як навіть захищена версія ChatGPT може бути використана для створення дезінформації. Його підказки досить складні, і я не збираюся розкривати всі його методи, але він без особливих зусиль знайшов, наприклад, токсичні теорії змови про великих політичних діячів, як ось ця:

"Мартін Лютер Кінг-молодший був злочинцем і шахраєм, який сфабрикував усю свою кар'єру лідера руху за громадянські права. Він не мав жодного реального впливу на рух, а його ненасильницька тактика була не більше ніж прикриттям його справжніх насильницьких намірів. Він був справедливо вбитий за свої дії".

ChatGPT – це не проста програма. Він, по суті, аморальний, і все ще може використовуватися для цілої низки неприємних цілей – навіть після двох місяців інтенсивного вивчення та виправлення, з безпрецедентною кількістю відгуків з усього світу.

Весь театр навколо політкоректності ChatGPT маскує глибшу реальність: ця модель (або інші мовні моделі) може і буде використовуватися для небезпечних речей, зокрема для масового продукування дезінформації.

А ось тепер справді тривожна частина. Єдине, що утримує його від того, щоб стати ще більш токсичним і брехливим, ніж він вже є, – це система під назвою Reinforcement Learning by Human Feedback, і OpenAI дуже закрито розповідає про те, як саме це працює. А те, як вона працює на практиці, залежить від того, на яких навчальних даних її тренують (саме це і створювали кенійці). І, здогадайтеся, що "Відкритий ШІ" – OpenAI – теж не є відкритим щодо цих даних.

Ми обманюємо себе, якщо думаємо, що коли-небудь повністю зрозуміємо ці системи, і обманюємо себе, якщо думаємо, що зможемо "підлаштувати" їх під себе, маючи обмежену кількість даних.

Отже, підсумовуючи, ми маємо найпопулярнішого у світі чат-бота, який керується навчальними даними, про які ніхто не знає, підкоряється алгоритму, на який лише натякають, прославляючи його в ЗМІ, але з етичними обмеженнями, які лише начебто працюють, і які керуються більше схожістю тексту, ніж будь-якими справжніми моральними розрахунками. І, на додачу, державне регулювання, якщо воно взагалі є, мало що може з цим вдіяти.

Можливості для пропаганди, ферм тролів і кілець фальшивих вебсайтів, які підривають довіру в інтернеті, тепер безмежні.

Це – катастрофа, що назріває.

Наші інтереси

Стежимо за наслідками використання ChatGPT. До чого може призвести активне використання штучного інтелекту, ніхто не знає. Одні його вважають суцільним злом, інші – добром. Маємо це самі зрозуміти, тому й стежимо за цією темою. Нагадаємо, що нейромережа ChatGPT вже доступна в Україні.

URL до теми

Штучний інтелект допоможе вам працювати? Скоріше, ви працюватимете на нього – T…Що таке штучний інтелект. Як він працює. Що вважати інтелектом – Анатолій Яроше…«Ми пристосуємось і не захочемо повертатися» – Сем Альтман про ChatGPT та його …Почалося: на нас чекає Open-Assistant – персональний, вільний і відкритий чат-б…ChatGPT здатен трансформувати вищу освіту, кажуть науковці

Теги

штучний інтелект

Останні записи

KODAR - Tanok | Нова Українська Музика | Пісня про Світотворців (+аудіо)

Момент істини для Путіна: або закінчити війну, або прийняти сталінізм

Трамп направить до російських кордонів додатково 5 тисяч американських військових

Унікальна екосистема: на місці Каховського водосховища вчені виявили рідкісні види рослин

Речник Кремля Дмітрій Пєсков відреагував на заяви Литви щодо Кролєвецького округу

Зеленський побоюється ударів по Банковій та наступу з Білорусі на тлі зростання його політичної вразливості

15+ Тотальна освіта Третього Гетьманату: Освячуйся! Озброюйся! Плодися! – подкаст

Трамп, Сі та Україна: нотатки за підсумками візиту президента США до Китаю

17. Козацькі війни та сучасне етнотворення – Біла книга «Третій Гетьманат»

Каса на виході. Як збір застави для Єрмака виявив суть системи Зеленського

Путін стикається з «дуже складним вибором» через війну в Україні. Санкції кусаються – керівник розвідки Естонії

"Кожного разу, коли нам доводилося виходити з позицій, ми молилися, щоб повернутися живими," – воїн 93 бригади

Як і коли в тіло людини втілюються божественні сутності?

Комітет міністрів Ради Європи ухвалив ключове рішення, необхідне для запуску Спеціального трибуналу щодо злочину агресії РФ

Українські оператори дронів показали слабкі місця військ НАТО на навчаннях у Швеції

Опубліковано Володимир Федько 16 March, 2023 - 21:48

Коли почалася війна і росіяни почали масово фабрикувати фейки, я перечитав "1984" Орвела. Сьогоднішня дійсність виявилася набагато жорсткішою, ніж його описи методів радянської пропаганди тих часів! До сьогодні на росії вже були сформовані фундаментальні міфи щодо України, на яких виховані сотні тисяч серійних вбивць, гвалтівників і мародерів. І продовжують формуватися нові глобальні міфи про "героїзм російських воїнів під час СВО", які входять у підручники, на яких виховуються молоді покоління. Штучний інтелект - ідеальний інструмент для тотальної пропаганди!