logo search
Болгарчук Р

П. С. Еще пару слов о управлении пк голосом.

Решил в конце прилепить свой расширенный и дополненный комментарий к видео и статье Oleg Lav «VoxCommando - общение с компьютером и управление голосом».

Прежде чем перейти к самому комментарию хочется заметить, что мне не раз приходилось встречать видео Олега, (полагаю это его настоящее имя). Они характеризуются не только необычностью, оригинальностью и рассмотрением глубоких тонкостей работы с программами, но и порой неординарным юмором. Как правило, для озвучки своих видео Oleg Lav использует голосовые движки, которым в этой книге уделено так же немало внимания. Движки довольно качественные, но эстетам, вникающим в фон, а не содержание, такие голоса могут резать слух. Но про это уже довольно подробно расписывал. Кто хочет оценить работу синтезаторов голоса, еще и в ипостаси дикторов для видео рекомендую видео Олега. Его вымышленные герои, не только могут обучить чему-то полезному, но и повеселить. Я и сам пару раз для разнообразия использовал для озвучки своих видео голосовые движки, и замечу, что это бывает порой очень удобно. Уж лучше такая озвучка, чем шипение, треск микрофона и беканье меканье которое на ютубе встречается в изрядном количестве на каналах разных дилетантов.

Теперь перейдем непосредственно к возможности управление компьютером с помощью голоса и моему комментарию к этому видео.

Это новая веха в развитии компьютерных программ. Жаль только, что она все не как не настанет. Я такими программками баловался еще лет 10 назад. Но их надо было обучать, что бы они привыкли к голосу. Часто они путали команды, особенно если команд много. Теперь уже появились онлайн сервисы. Такие сервисы понимают произносимое, в основном, с первого раза. Т.е. на много лучше древних офлайн программок. Но, как правило, функционал данных сервисов ограничен и предназначен для баловства в интернете: проложить маршрут, посмотреть погоду, найти песню, ну или тупо ни о чем поговорить с железным другом или подругой.  Теперь же надеюсь, что всё-таки эти программы станут офлайн и портативными. Т.к. интернет есть до сих пор далеко не везде, несмотря на то, что его бесплатное появление пророчат вот-вот, каждый год, уже как минимум лет 5 подряд. Но все нет и нет. А портативная программа, которую можно было бы кинуть на флеху, запустить на любом компе и просить его сделать то или иное действие, это было бы супер. Главное, чтобы команды комп не путал: нормально распознавал вашу речь. Перспектив у такого направления выше крыши. С помощью такого разговора, можно было бы даже программы создавать, на основе алгоритма поочередно повторяющихся команд. Говорить с компьютером «на ты», на привычном вам языке, могли бы люди совершенно незнакомые с программированием. И для этого не надо учить сложные коды на английском или, того хуже каком-то птичьем, машинном языке. Например, сколько раз мне приходилось выполнять рутинные действия, которые можно было бы делегировать ПК и такому помощнику. Что бы он сам, к примеру, копировал что-то, переключался между приложениями и вставлял в новое поле, искал, удалял дубликаты фото, чистил, синхронизировал и многое другое. Не надо было бы лезть в консоль или запускать тоталкомандер. Просто можно было бы сказать – «открой мои фотографии», выдели все с 02.12.2019 по 5 января 2018 и переименуй их все, дописав в имя фотографии его дату и фразу «новый год»». Но пока про это говорить наверно рано. Хотя уже можно было бы записать свой голос с последовательными более простыми рутинными командами и проигрывать его. Программа сама бы делала то, что произноситься. Например, я имею привычку копировать статьи вместе с гиперссылками, чтобы потом, при необходимости, можно было бы найти их. Это можно было бы поручить программам. Они бы копировали сам текст, а потом переходили в адресную строку, копировали ссылку и вставляли его под текстом. Это уже сейчас можно сделать, записав в автокликере горячие клавиши. Например: Alt-D , Ctrl +C, Alt+Tab, (стрелка вниз) , Enter, Ctrl+V. Данная не хитрая комбинация переходит в адресную строку, копирует ссылку, переходит в документ (если он открыт и это окно было активно перед этим) и вставляет ссылку ниже текста. Этой всей комбинации можно было бы присвоить голосовую команду «добавь ссылку». И компьютер сам бы это все делал без лишних телодвижений. Особенно это удобно, если вам таких ссылок, или подобных действий надо сделать пару тысяч за день. Так же можно было бы вовсе отказаться от клавиатуры, например, произнеся команду запуска голосового блокнота, в который можно надиктовывать текст. К сожалению, пока он, как и подобные, сервисы только онлайн. Впрочем, странно, что уже эта программа, раз воспринимает речь, не может записывать надиктованный текст. Или переводить речь в буквы, нужный функционал уже есть. А если объединить этот функционал с органайзерами, напоминалками то цены бы такой системе не было. Может через лет 50 таки докрутят, и появится такая система... Но и за это уже спасибо. Буду пробовать, если время найду.  Или ждать пока появится для подобных программ свой Гульельмо Маркони, собравший пару деталек в коробку и получивший радио. Увы, пока такого Маркони для подобных программ нет. А ведь уже давно пора объединить вместе голосовые команды, синтезаторы речи, программы для перевода речи в текст (будь то напрямую с микрофона, или с записи, с расстановкой знаков препинания, а не как сейчас…) и добавить им какой-то хороший аналитический движок типа Картаны, Яндекс строки, Алисы, Siri и т.п... А также, естественно, не забыть о аутокликерах. Это так же немаловажная деталь, о которой почему-то создатели подобных сервисов забывают. Это все можно было бы сделать на базе наиболее дружелюбной и удачной операционной системы, а именно виндовс Хр. Или по её аналогии реализовать это все на каком-то линуксе. Это все я написал очень сумбурно. Мог бы конечно написать отдельную книгу, как конкретно все реализовывать, но у меня как обычно нет времени. Жаль, что официальных ученых в данном направлении нет. По крайней мере, мне неизвестны. А софтом занимаются уже не программисты, а спекулянты и промоутеры. Они-то и внушают быдлу, новые веяния убогих онлайн сервисов и деревянных операционных систем. А ведь все могло бы быть по-другому. Компьютер мог бы стать для человека незаменимым помощником, без преувеличения в любом деле. Помощником, дающим возможность запоминать и оперировать огромными объемами информации, уже молчу о том, что вы бы могли пересмотреть любой фрагмент своей жизни. Найти что, когда и кому вы говорили. Что куда положили и многое другое. Планировать с пользой каждый день. Автоматизировать многие рутинные интеллектуальные монотонные дела, отбирающие львиную долю времени. А после смерти (если её таки не удастся преодолеть), оставить информационный слепок себя, который бы продолжал жить своей жизнью, продолжая ваше дело, ваши задумки, реализовывая ваши мечты и развиваясь так, как бы развивались вы.