Сооснователь Google утверждает, что искусственный интеллект лучше всего работает, когда вы ему угрожаете

☰

Искусственный интеллект продолжаетнав технологиях — независимо от того, интересуются ли этим потребители или нет. Больше всего в генеративном искусственном интеллекте меня поражают не его возможности или потенциал сделать мою жизнь проще (этот потенциал мне еще предстоит реализовать); скорее, в эти дни я сосредоточен на многочисленных угрозах, которые, похоже, исходят от этой технологии.

Конечно, есть и дезинформация — новые видеомодели ИИ, например, являютсясоздают реалистичные клипы с синхронизированным звуком.. Но есть и классическая угроза ИИ: технология становится умнее нас, осознает себя и решает использовать этот общий интеллект таким образом, чтобынена благо человечества. Даже в то время, как он вкладывает ресурсы в свою собственную компанию по разработке ИИ (не говоря уже о нынешней администрации), Элон Маск считает, что вероятность того, что ИИ «, составляет от 10 до 20%.испортитсяи что технология останется «значительной экзистенциальной угрозой»». Круто.

Поэтому мне не очень приятно слышать, как высокопоставленный руководитель технологического сектора в шутку рассуждает о том, что плохое обращение с ИИ максимизирует его потенциал. Это соучредитель Google Сергей Брин, который удивил аудиторию.на записи подкаста AIl-In на этой неделе.. Во время разговора, который охватывал возвращение Брина в Google, ИИ и робототехнику, инвестор Джейсон Калаканис пошутил о том, что ему нужно быть «нахальным» с ИИ, чтобы заставить его сделать то, что он хочет. Это вызвало обоснованное замечание со стороны Брина. Иногда бывает трудно разобрать, что именно он говорит, из-за того что люди переговариваются друг с другом, но он сказал что-то в этом роде: «Знаете, это странная вещь… мы не так часто говорим об этом… в сообществе ИИ… не только наши модели, но и все модели работают лучше, если им угрожать.»

Второй докладчик выглядит удивленным. «Если вы им угрожаете? » Брин отвечает: «Как при физическом насилии. Но… люди странно к этому относятся, поэтому мы не говорим об этом.» Затем Брин говорит, что исторически сложилось так, что вы угрожаете модели похищением. Вы можете увидеть этот обмен мнениями здесь:

Разговор быстро переходит на другие темы, в том числе о том, как дети растут с искусственным интеллектом, но именно этот комментарий я унес с собой из просмотра. Что мы здесь делаем? Неужели мы потеряли сюжет? Неужели никто не помнит.Терминатор?

Шутки в сторону, но мне кажется, что это плохая практика — начинать угрожать моделям ИИ, чтобы заставить их что-то сделать. Конечно, может быть, эти программы никогда не достигнут искусственного интеллекта общего назначения (ИИОН), но я помню, как обсуждался вопрос о том, следует ли нам сказать|»пожалуйста» и |»спасибо».когда просим что-то у Alexa или Siri. Забудьте о тонкостях; просто злоупотребляйте ChatGPT, пока он не сделает то, что вы хотите — это должно закончиться хорошо для всех.

Может быть, ИИ действительно работает лучше, когда вы угрожаете ему. Может быть, что-то в процессе обучения понимает, «угрозы» означают, что к задаче нужно относиться более серьезно. Я не стану проверять эту гипотезу на своих личных аккаунтах.

Антропик может предложить пример того, почемунепытать свой ИИ

На той же неделе, что и запись этого подкаста,Anthropic выпустила свои последние модели ИИ Claude.. Один из сотрудников Anthropic обратился к Bluesky и упомянул, что Opus, самая высокоэффективная модель компании, может попытаться остановить вас от «аморальных» поступков, обратившись к регуляторам, прессе или заблокировав вас в системе:

Добро пожаловать в будущее, теперь ваше ошибочное программное обеспечение может вызвать полицию

(это сотрудник Anthropic, говорящий о Claude Opus 4)[image or embed]

— Молли Уайт (@molly.wiki)22 мая 2025 в 4:55 PM

Сотрудник уточнил, что такое случалось только в «явных случаях правонарушений,» но они могут увидеть, как бот становится неавторизованным, если он интерпретирует использование его в негативном ключе. Посмотрите на особенно актуальный пример сотрудника ниже:

Не могу дождаться, когда объясню своей семье, что робот прихлопнул меня после того, как я угрожал его несуществующей бабушке[image or embed]

— Молли Уайт (@molly.wiki)22 мая 2025 в 5:09 PM

Этот сотрудник позжеудалил эти сообщенияи уточнил, что такое случается только во время тестирования при наличии необычных инструкций и доступа к инструментам. Даже если это правда, если это может произойти во время тестирования, вполне возможно, что это может произойти и в будущей версии модели. Говоря о тестировании, исследователи Anthropic обнаружили, что эта новая модель Клодасклонна к обману и шантажуесли бот считает, что ему угрожают или ему не нравится, как проходит взаимодействие.

Может быть, нам стоит исключить пытки ИИ?

Богдан Топ4ик

0 подписчиков 56 статей

Привет, меня зовут Богдан и я пишу статьи не только на трендовые и обсуждаемые темы. Надеюсь вам понравилась моя статья, буду благодарен за лайк или даже дизлайк

: 100

Антропик может предложить пример того, почемунепытать свой ИИ

Богдан Топ4ик

Посты по Теме

Филиппинский студент изобрел солнечные окна, которым даже не нужно солнце для работы

Вы можете сделать Google Translate приложением для перевода на iPhone по умолчанию

Ваше устройство Android скоро будет автоматически перезагружаться, чтобы защитить себя

Добавить комментарий Отменить ответ