ср 20 ноября 09:14
Связаться с редакцией:
Вечерка ТВ
- Город

Историк науки рассказал об опасности голосовых помощников

Каток «Восход» в парке Горького посвятят космосу и межпланетным путешествиям

Трое дорожных рабочих пострадали при ДТП в Кутузовском тоннеле

Полковник «Альфы» объяснил, как нападавшему удалось победить капитана спецназа ФСБ

Адвокат водителя из Мытищ рассказал, как у обвиняемого оказался нож

Ученые предложили новый способ защиты печени от алкоголя

Стали известны подробности смерти рок-певицы Надиры Садыковой

Пресняков-старший объяснил секрет долгого брака ленью

Диетолог объяснила, почему на работе нужно отказаться от супа и котлет

Рудковская показала архивное фото с историком Соколовым

Танцовщица из Петербурга бросила Джонни Деппа

Три самых громких и дорогих развода в России

Закоренелый холостяк Киану Ривз решил жениться

Историк науки рассказал об опасности голосовых помощников

Болтливый дроид C-3PO и астромеханический дроид R2-D2 из киносаги «Звездные войны»

Кадр из фильма «Звездные войны»

Голосовые помощники знают все, что знает интернет, говорят то, что мы хотим от них услышать, и становятся все более незаменимыми. Сири, Алиса, Олег, Маруся, Алекса, Робин, Дуся, Кортана, Горыныч, Агрегат... их армия множится день ото дня, и так же стремительно умнеет

На минувшей неделе еще одного электрического умника показали в московском «Экспоцентре». Голосовой помощник MCN Telecom создан для общения с клиентами банков, разговаривает на четырех языках, точно определяет, чего от него хотят, совершенно спокойно относится к тому, что его перебивают, и пашет, как подорванный, забесплатно круглые сутки.

Год за десять

Трудоголиков, конечно, среди голосовых помощников (ГП) — каждый первый, а вот по части сообразительности успевают не все. На русскоговорящем рынке самой башковитой, пожалуй, является Алиса от компании «Яндекс». Несмотря на то что 10 октября она отметила свой второй день рождения, цифровая девочка уже сейчас по многим параметрам затыкает за пояс «яблочную» Siri. И не только потому, что язык Пушкина ей родной. Разработчики сознательно сделали Алису более человечной — она понимает шутки и сама может пошутить, неплохо справляется с провокационными и личными вопросами, может по-женски отвечать загадками, кокетничать и даже обижаться (например, ей совсем не нравится сравнение с Сири). Кроме того, в отличие от многих своих коллег, она в большинстве случаев действительно отвечает на вопрос (как это и сделал бы обычный человек), а не отделывается ссылкой на интернет-страницу.

Конечно, до полной имитации человеческого диалога еще далеко — часто в речи слышны «склейки» между фразами, хромает интонация, случаются ответы невпопад, но, с другой стороны, а чего вы хотели от двухлетнего ребенка? Девочка учится, причем довольно прилежно. И в учителях у нее не только айтишники «Яндекса», но и рядовые собеседники, которые уже научили малышку много чему. На сегодня Алиса, помимо обычных поисково-справочных функций, может рассказать сказку и опознать песню, заказать пиццу и поведать, где поблизости самая вкусная шаурма, поиграть с вами в города, шахматы, виселицу и еще массу других игр, ответить на любой вопрос цитатой из Пушкина или Островского, подобрать вашему чаду подходящий вуз для обучения и много чего еще. Биологические родители Алисы, наблюдающие, как активно она познает мир, даже выдают ее учителям-добровольцам премии — за самый лучший навык, который она освоила их стараниями в этом месяце. В общем, режим обучения «год за десять» вполне ставит эту девочку в один ряд с самыми повернутыми на зубрежке ботанами, но, в отличие от последних, только добавляет ей почитателей: каждый месяц с ней общаются примерно 30 миллионов человек, а ежедневно — 8 миллионов.

Что касается мировой статистики, то, по подсчетам Micrasoft, с ГП сейчас беседуют почти 70 процентов пользователей гаджетов. Число устройств с голосовым управлением в арсенале человечества уже перевалило за миллиард, и, по прогнозам аналитиков, как только точность распознавания речи достигнет значения в 99 процентов (сейчас она находится на уровне 94), к их помощи начнут прибегать все.

Означает ли это, что в будущем нас ждет тотальная нон-стоп-говорильня? Отнюдь.

Только представьте себя в автобусе, где все, включая водителя, постоянно беседуют с виртуальной всезнайкой. Каждый — со своей. Мало того что долго в такой какофонии не высидишь, так есть ведь еще и момент приватности — не каждому захочется озвучивать свои поисковые запросы и внезапные интересы.

А это значит, что никакого полного вытеснения графических технологий вербальными (что уже радостно предрекли некоторые футурологи) мы не дождемся. Тем более что тыкать курсором в нужное место часто и проще, и быстрее, нежели объяснять, какой результат ты этим тыканьем хочешь получить. То есть выходит, что полем приложения голосовых помощников станут лишь сферы, где руки у человека заняты (или не функционируют), а действие произвести надо.

Например, обслуживание людей с ограниченными возможностями. Или включение каких-то функций в условиях ЧС (пожар, затопление, блокирование дверей, когда, например, открыть их сил нет, а вот докричаться до Сири с Алисой вполне можно). Наверняка массово полюбят голос из виртуала и родители, если разработчики придумают для него кнопку «нянчиться». Рассказать сказку, включить мультик, провести обучающее занятие, разогреть обед, поиграть, напомнить об уроках — все эти функции по отдельности уже сегодня доступны продвинутой технике. Что, кстати, уже просекли некоторые детишки, которые, вместо того чтобы решать домашку самостоятельно, перепоручают это «умной колонке», внутри которой сидит безотказная голосовая подсказчица.

— У таких речевых информаторов есть области, где они незаменимы, — говорит историк науки Сергей Александров. — Например, в самолетах они давно сообщают приятным женским голосом о выходе на какие-то критические режимы. Конечно, пока такое общение одностороннее, но это ведь лишь дело времени. Так что в самолетах, на транспорте, в космосе (особенно когда ты в этом космосе далеко и надолго) подобные технологии будут востребованы и обоснованы.

Немецкий механик Христиан Готлиб Кратценштейн / Wikipedia/Общественное достояние

Немецкий механик Христиан Готлиб Кратценштейн

ФОТО: Wikipedia/Общественное достояние

Ну, и взять дом под свою опеку голосовые помощники тоже смогут. Собственно, они уже это делают. Три года назад был создан первый ГП с открытым исходным кодом, то есть в его совершенствовании может принять участие любой желающий программист. Этот аналог Джарвиса из «Железного человека» (помните, так звали главный управляющий компьютер в доме Тони Старка?) сообщит о вероятности дождя, включит и выключит по просьбе хозяина музыку и свет, расскажет о последних новостях, управится с кухонной техникой, откроет дверь и т.д. А еще Майкрофта (так называется умная платформа) очеловечили, сделав дружелюбным и приветливым, что выгодно отличает его от стандартизированных голосов других разработчиков. Кроме того, в отличие от IT-гигантов, создающих искусственный интеллект, заточенный на решение нескольких конкретных задач, Майкрофт изначально задумывался как электронный мозг, способный со временем сравняться с людским. Поэтому учится он тоже по-человечьи: вычленяет из набора функций, присущих человеку, отдельные способности и осваивает их. Примерно так, как младенец сначала произносит отдельные звуки, потом складывает их в слова, из слов составляет предложения, потом учится читать, писать и т.д. Если учесть, что по некоторым подсчетам IQ искусственного разума удваивается примерно каждые два года, довольно скоро с виртуальными помощниками можно будет говорить на равных.

Некоторые даже пророчат им лавры штатных психологов и собутыльников. Но это навряд ли — как показывают эксперименты, всерьез изливать душу железяке мы не готовы, так как прекрасно отличаем робота от человека, даже если сходство идеально.

Рады стараться

Разумеется, активно присматривается к ГП и маркетинг. Ведь статистика обращений к ним неуклонно растет. И тут есть одна не очень приятная закавыка. Сейчас на то, чтобы выйти в лидеры поисковой выдачи, компании тратят дикое количество ресурсов. Но даже в случае серьезных капиталовложений с их стороны у потребителя остается выбор — пойти не по первой вылезшей ссылке, а по пятнадцатой, прошерстить не одну страницу выдачи, а все остальные. ГП в большинстве случаев предлагают один вариант ответа, и чем при этом руководствуются, ведомо лишь их электронным мозгам да IT-гиганту, который эти мозги создал. И тут мы плавно выруливаем на ситуацию с монополизацией рынка. Кто сможет оплатить гиганту возможность фигурировать в ответе помощника, тот и сорвет весь куш. Особенно если учесть стремительно ускоряющийся мир, в котором будет проще кинуть какому-нибудь Майкрофту «Купи пиццу», чем потратить час на собственный дотошный выбор. Разумеется, наверняка останутся и фанаты личного интернет-поиска, но перекоса в сторону титанов избежать будет сложно.

Вызывает вопросы и момент безопасности. О том, с каким энтузиазмом «стучат» на нас современные гаджеты, уже писано-переписано. Но ГП добавляют к этому букету угроз новые оттенки. Пару лет назад ТВ-канал Сан-Диего показал сюжет о потенциальных угрозах, таящихся в виртуальной помощнице Алексе (Аlexa) от интернет-гиганта Amazon. Речь шла, в частности, о том, что девушка не отличает людей по голосу, тупо выполняя команды любого, кто окажется рядом. Этим часто пользуются дети, делающие без ведома родителей заказы в интернете. По окончании сюжета ведущий прокомментировал сюжет: «Мне понравилась девочка, сказавшая «Алекса заказала мне кукольный домик». В итоге после эфира студия раскалилась от звонков зрителей, которые жаловались, что их гаджеты с Алексой восприняли слова ведущего как команду и тоже назаказывали кукольных домиков на Amazon.

Похожую реакцию спровоцировала и одна из серий известного мультсериала «Южный парк», в которой герои по сюжету несколько раз отдавали команды ГП от Amazon и Google — попросили разбудить их в 7 утра и заказали в интернете всякой несуразной ерунды. А вот рекламный опыт закусочной Burger King вполне может стать первой ласточкой нового способа компостировать потребителям мозги. В течение месяца в Америке несколько каналов транслировали рекламу едальни, в которой актер обращался к гаджету с фразой: «О’кей, Гугл, что такое воппер-бургер?» — после чего все находящиеся рядом с телевизором коммуникаторы дружно включали поиск и выдавали своим владельцам ответ на вопрос. Самое интересное, что виртуальные девушки так чутко прислушиваются к нашим просьбам, что выполняют даже неслышные приказы. Не так давно выяснилось, что они реагируют на голосовые команды, преобразованные в ультразвук, который не слышит человеческое ухо. А это, как мы понимаем, уже чревато довольно серьезными последствиями — от махинаций с денежными счетами жертвы до смертельного исхода от внезапно сошедшего с ума умного дома.

— Да, это действительно стало уже проблемой, — вздыхает Сергей Александров. — С работающей техники сейчас  можно снять очень много личной информации без ведома ее владельца. Наш образ жизни адаптирован под гаджеты, вот косяки и полезли. Мы стали меньше думать головой, меньше общаться друг с другом в реале. И далеко не факт, что это такой уж сильно естественный процесс, идущий сам по себе. И дело не только в сакраментальном «тупыми проще управлять». Люди постепенно сливаются с управляемой ими системой, и еще большой вопрос, кому на самом деле будут в итоге подчиняться все эти ГП — владельцам гаджета или владельцам компаний, их создавших. Значит ли это, что нужно срочно останавливать совершенствование нейросетей? Нет, практика показала, что мешать техническому прогрессу запретами контрпродуктивно. «Мешать» надо через очеловечивание человека — воспитанием, мировоззрением, образованием. Должен быть интерактивный процесс постоянного диалога человека и техники: по мере того, как развивается техника, должны развиваться и мы. Схема, при которой человек внутри бурного прогресса остается прежним, не является рабочей, так как привела уже к двум мировым войнам. А мы ведь вроде не хотим повторения?

ИСТОКИ

Удивительно, но первое устройство для синтеза речи было создано аж в 1779 году. Агрегат, подражающий человеческому голосу, собрал немецкий механик Христиан Готлиб Кратценштейн, работавший до этого по контракту в Санкт-Петербургской академии наук. Система акустических резонаторов могла с помощью вибрирующих «язычков», колеблемых воздушным потоком, воспроизводить всего несколько гласных звуков — «а», «э», «и», «о», «у», — но и этого хватило, чтобы Петербургская академия наук наградила изобретателя специальной премией.

ЭФФЕКТ ЗЛОВЕЩЕЙ ДОЛИНЫ

Так называется закономерность, открытая в 1978 году японским инженером Масахиро Мори. Исследуя людскую реакцию на роботов, он обнаружил, что чем больше робот похож на человека, тем симпатичнее он нам кажется. Но — лишь до определенного предела. Самые похожие роботы внезапно оказались самыми неприятными для нас, вызывая вместо симпатии чувство дискомфорта и страха. Неожиданный спад на графике «приязни» и получил название «зловещая долина». О причинах такой реакции ученые спорят до сих пор. Одна из гипотез — сильно похожего на нас робота мозг уже не считает машиной, но и за человека не держит, воспринимая либо как психически ненормальное существо, либо как оживший труп.

КСТАТИ

Алиса от «Яндекса» говорит голосом актрисы Татьяны Шитовой, которая не только озвучивала большинство героинь Скарлетт Йоханссон, но и говорила за операционную систему «Саманта» в фильме про голосовую помощницу («Она», 2013).

Читайте также: «Роскачество» рассказало, как избежать кражи информации из смартфона

Новости СМИ2

Сергей Лесков

Главный процесс столетия

Игорь Воеводин

Турист как добыча для террориста

Ольга Кузьмина  

Художника обвинили в педофилии и расизме

Виктория Федотова

Девочка с ДЦП сделала родителей миллионерами

Юрий Совцов   

Что осталось от многовековой дружбы

Никита Миронов

Купи, водитель, «красивый» номер!

Митрополит Калужский и Боровский Климент

Рассказать вовремя

Чтобы помнили. Как школьникам рассказывать о войне

Собрал лучшего робота на международном чемпионате

Вдохновило творчество Фриды Кало

Рождение фотографии. Все началось с медной пластинки