Pаспознавание речи и мгновенный перевод. Как перевести аудио звук или видео ролик в печатный текст. Мой опыт транскрибирования Предустановленный софт будет транскрибировать речь

Здравствуйте, друзья. Сегодня последняя статья из серии про профессию транскрибатор, в которой я расскажу, как новичку сделать транскрибацию максимально просто и быстро.

Показывать буду на примере одной из , о которых мы вчера разговаривали. Также приведу интересный способ, как можно делать расшифровку записей в текст с помощью распознавания речи.

Способ 1

Express Scribe — это профессиональная программа, которой пользуются практически все, кто занимается переводом аудио- и видеозаписей. Она имеет все необходимые функции, которые требуются.

После установки данной программы и запуска, вы увидите такое окно.

Она, к сожалению, не имеет интерфейса на русском языке, но в ней и так всё понятно и настроек особых не требуется. Просто установите её и работайте.

Удобство этой программы заключается в том, что не нужно переключаться между окнами проигрывателя и текстовым документом, прослушивать запись и набирать текст можно сразу в одном месте.

Шаг 1. Чтобы загрузить свои файлы, которые нужно транскрибировать, нажмите кнопку «Load» или просто перетащите их из вашей папки, где они лежат, в самое верхнее окно.

Шаг 2. Изучите или напишите себе шпаргалку, какие горячие клавиши вам потребуются в работе.

Стандартные настройки горячих клавиш:

  • F9 — воспроизведение записи.
  • F4 — пауза.
  • F10 — воспроизведение с обычной скоростью.
  • F2 — воспроизведение на низкой скорости (50%).
  • F3 — воспроизведение на высокой скорости (150%).
  • F7 — перемотка назад.
  • F8 — перемотка вперёд.

Удобно, что клавиши воспроизведения и паузы настроены под разные руки, и через некоторое время мышечная память их легко запомнит.

Шаг 3. В нижнем правом углу программы установите комфортную для вас скорость проигрывания записи. Можно замедлить до такого состояния, чтобы успевать печатать, не делая паузу.

Шаг 4. Можно начинать делать транскрибацию.

Также для записи вы можете отрегулировать каналы аудио, чтобы звук был лучше и понятнее, просто включите запись и подвигайте шкалы до лучшего качества.

Шаг 5. После того, как вы сделали перевод из аудио в текст, скопируйте получившийся текст в документ Word для сохранения и последующего его редактирования.

Способ 2

Второй способ заключается в том, чтобы не набирать текст на клавиатуре самостоятельно, а чтобы он набирался автоматически с помощью сервисов распознавания голоса.

В Гугл документах эта функция находится во вкладке «Инструменты» -> «Голосовой ввод...» или запускается сочетанием клавиш CTRL+SHIFT+S.

Заключение

Вот такие два совершенно простых способа, которые помогут вам сделать транскрибацию и заработать (для кого-то первые) деньги через интернет.

Профессия «транскрибатор» очень простая и с ней может справиться каждый, поэтому здесь не так много можно зарабатывать. Я рекомендую вам ознакомиться с другими интересными специальностями в книге « », на которую я недавно делал обзор.

Если у вас возникли ко мне какие-то вопросы или пожелания, то всегда можете написать их мне ниже в комментариях к этой статье. Желаю удачи в освоении данного направления и хороших доходов в удалённой работе!

Сервисы, которые бесплатно расшифруют запись интервью и голосовые сообщения в текст. В подборке отдельные программы и боты в социальных сетях. Будет полезно копирайтерам и журналистам.

Использовать голосовой набор не всегда удобно, если это не запросы в поисковики. В шумной обстановке не получается прослушать запись, некоторые люди в принципе лишены такой возможности. Если надиктованная информация нужна в печатном виде, войсы приходится переслушивать и перепечатывать, это тратит время и силы.

Зачем может понадобиться конвертировать аудио в текст:

  1. Расшифровать запись длинного интервью для статьи.
  2. Надиктовать себе идей, пока есть вдохновение.
  3. Понять, о чем говорят в голосовом сообщении, когда нет возможности послушать.
  4. Общаться с людьми с особенностями слуха.

Для расшифровки аудио в текст есть специальные сервисы, мы протестировали несколько и выбрали самые удачные. Всеми сервисами из подборки можно пользоваться бесплатно, но в некоторых нужно будет зарегистрироваться.

Сервисы для перевода речи в текст

Блокнот для речевого ввода

Блокнот переводит диктуемые слова в текст, транскрибирует аудиозаписи с голосом и видео с Ютуба.

Сервис автоматически расшифровывает произносимые слова по ходу надиктовки, причем умеет распознавать знаки препинания, если отметить пункт «Заменять слова пунктуации». Мы надиктовали ему «Привет восклицательный знак мы тестируем запятая как справляется сервис с расшифровкой текста точка» и так далее, самые часто употребляемые знаки он распознал, но не справился с многоточием, тире, скобками и кавычками.

Тест сервиса на знаки препинания

Транскрибирование текстов из загруженных аудиозаписей и из видео с Ютуба происходит в реальном времени при воспроизведении. Загружаем файл в сервис или указываем ID видео (символы после https://www.youtube.com/watch?v=), нажимаем «Включить запись».

Сервис распознает речь ведущего

Бесплатно сервис работает с транскрибированием онлайн без ограничений, а также с распознаванием голоса на аудио и видео не дольше 15 минут.

Платный формат дает интеграцию с Windows и Linux, позволяет расшифровывать медиафайлы длиной более 15 минут и обрабатывать файлы по нескольку штук одновременно.

Лучше всего Речевой блокнот справляется с расшифровкой голоса в реальном времени. Результат довольно чистый, но нужно привыкнуть называть все знаки препинания или расставлять их вручную при вычитке.

Инструмент полезен, когда нужно надиктовать себе материал для текста или в заметку, а на интервью его можно включить фоном, чтобы расшифровывал речь в реальном времени.

Расширение «Голосовой ввод текста» для Google Chrome

Попробуем надиктовать сообщение в ВКонтакте:

Открываем диалог, кликаем правой кнопкой мыши и выбираем расширение.

Выбор расширения по клику правой кнопкой

Ввод подсвечивается красным, в браузере появляется окно разрешения доступа к микрофону. Разрешаем доступ, диктуем сообщение, называя знаки препинания: «Настя запятая привет восклицательный знак как твои дела вопросительный знак», готовый текст отображается в поле ввода.

Готовый текст сообщения

Сложно привыкнуть диктовать знаки препинания, на их озвучивание уходит много времени, но зато не нужно расставлять запятые вручную.

Результат расшифровки зависит от дикции говорящего, но в целом расширение для ввода хорошо справляется.

Dragon Dictation

Программа для iOS, работает онлайн через iTunes Store. Удобно использовать на мобильном, чтобы надиктовывать на ходу замечания или идеи к новым статьям.

Расшифровка войса в программе

Программа работает бесплатно, но только на iOS.

Otter

Сервис для распознавания речи и расшифровки аудио или видео. Работает только с английским языком. Если не пропустить первые шаги настройки и прочитать сервису текст на экране, он запомнит ваш голос. Это позволит ему отделять ваши реплики от чужих в записях с несколькими собеседниками.

Прочитайте это сообщение, чтобы бот вас запомнил

Сервис транскрибировал фразу на английском

Фразу «расшифруй что-нибудь на русском» он распознал так:

Фразы на других языках сервис не понимает

Можно загрузить аудио или видео с английской речью, сервис выведет екст. Некоторые спорные моменты из-за произношения могут расшифровываться неправильно.

Сервис не распознал слово penguins

Программа бесплатна, она будет полезна, если вы работаете с англоязычными источниками.

Титровщик телефона для глухих и слабослышащих

Превратите ваш экран в удивительном заголовка телефона. Это полностью автоматический, без человеческого слуха-машинистки ваши разговоры. Находят бабушки и дедушки трудно услышать семью и друзей по телефону? Включите Speechlogger для них и остановить кричать по телефону. Просто подключите аудиовыход телефона к аудио входу компьютера и запустить Speechlogger. Это также полезно в лицом к лицу взаимодействия.

Автоматическая транскрипция

Вы записали интервью? Сохранить некоторое время на переписывание его, с автоматическим речи Google, к тексту, принесла в ваш браузер по Speechlogger. Воспроизведение записанного интервью в микрофон вашего компьютера (или линии) в-и пусть speechlogger сделать транскрипцию. Speechlogger сохраняет транскрипции текст вместе с датой, временем и ваши комментарии. Она также позволяет редактировать текст. Телефонных разговоров могут быть расшифрованы с помощью того же метода. Вы также можете записать аудио-файлы непосредственно с компьютера, как описано ниже.

Автоматический устный и письменный переводчик

Встреча с иностранными гостями? Принесите ноутбук (или два) с speechlogger и микрофона. Каждая сторона будет видеть друга произнесенные слова, переведенные на их родном языке в режиме реального времени. Это также полезно на телефонный звонок на иностранном языке, чтобы убедиться, что вы в полной мере понять другую сторону. Подключите аудиовыход вашего телефона, чтобы линейный вход вашего компьютера и начать Speechlogger.

Изучайте иностранные языки и улучшайте навыки произношения

Speechlogger является отличным инструментом для изучения языков и может быть использован u200b u200Bin несколько способов. Вы можете использовать его, чтобы узнать словарный запас, говоря на вашем родном языке и давая программного обеспечения перевести его. Вы можете учиться и практиковать правильное произношение, разговаривая на иностранном языке и, видя, понимает ли Speechlogger или нет. Если расшифрованы текст в черным шрифтом это означает, что вы произнес это хорошо.

Генерирование субтитров для фильмов

Speechlogger может автоматически записать фильмы или другие звуковые файлы. Затем возьмите файл и автоматически перевести его на любой язык, чтобы произвести международные субтитры.

Диктуйте вместо ввода

Написание письма? Документы? Списки? Резюме? Независимо от того, вам нужно ввести, попробуйте диктовать его Speechlogger вместо этого. Speechlogger будет автоматически сохранять его для вас, и позволит экспортировать его в документ.

Забавная игра:)

Вы можете имитировать китайскую динамик? Французский? Что о русском языке? Попробуйте имитировать иностранный язык и увидеть то, что вы только что сказали, с Speechlogger. Используйте синхронный перевод Speechlogger, чтобы понять, что вы только что сказали. Получить удивительные результаты - это очень весело!

Существует множество профессий, о которых слышали лишь единицы. Немногие могут сказать, чем занимается транскрибатор. Этот пробел может восполнить статья, представленная ниже. Она будет интересна каждому, кто хочет найти легкую удаленную работу.

Что это такое?

Транскрибация — это перевод речи из аудио или видеоформата в текстовый. Иначе говоря, так называется создание напечатанного, логически связанного текста, пригодного для последующей редакции из аудио- или видеозаписи. Кстати, с примерами транскрибации знакомы все. Наверняка каждый хотя бы раз видел видеоматериал, сопровождающийся субтитрами.

Главное, что требуется тем, кто решил зарабатывать транскрибацией — хороший слух, позволяющий четко разбирать русскую или иностранную речь. Кроме того, необходимо умение набирать текст на клавиатуре компьютера. Таким образом, чтобы заниматься оказанием услуг «расшифровки» аудио- или видеофайлов, не требуется никаких особых навыков и знаний, особенно если речь идет о работе с материалом на родном языке.

Единственное, что может помешать зарабатывать деньги, оказывая услуги транскрибации, — медленный набор текста. Помните, что скорость и мастерство быстро приходят вместе с практикой.

Транскрибация аудио в текст: преимущества

Это занятие выбирают, если появилась необходимость подзаработать, но нет возможности устроиться на подходящую работу, а также отсутствует образование. Кроме того, транскрибация помогает:

  • научиться быстрее печатать на клавиатуре вслепую;
  • развить память, так как приходится кратковременно запоминать большие аудиофрагменты;
  • стать внимательнее, усидчивее, терпеливее;
  • научиться грамотно писать.

Еще один плюс, который присущ транскрибации, — это возможность работать удаленно, то есть в удобное для вас время и без необходимости ежедневно ездить на работу, тратя на дорогу деньги и время. Именно последнее обстоятельство делает это занятие крайне привлекательным для мам в декрете и для студентов очной формы обучения.

Минусы

Главный недостаток работы транскрибатором — сравнительно невысокая стоимость услуги. Однако в любом случае при серьезном подходе можно будет получать неплохие деньги, если учесть, что вам не придется работать вне дома.

К минусам относится необходимость долгое время сидеть на одном месте и то, что в таком занятии нет места творчеству.

Кто заказывает

Транскрибацию аудио в текст обычно выбирают те, кто берет интервью, организует конференции, занимается обзвоном клиентов, инфобизнесом и прочее. При этом качество записи аудио или видео у заказчика может быть как хорошего, так и очень плохого качества.

Транскрибация требуется для аудиозаписей, сделанных в ходе:

  • телефонных разговоров;
  • семинаров/вебинаров;
  • интервью;
  • аудиоподкастов;
  • телепередач.

Кроме того, есть много людей разных профессий, которым проще записать мысли на диктофон, а затем попросить транскрибатора сделать из аудио статью или книгу.

Чего хотят заказчики?

У тех, кому необходима транскрибация разговоров, лекций или другого аудио в текст, могут быть разные требования, в зависимости от поставленных перед ними задач.

В самом простом случае нужно печатать услышанные фразы, разбивая текст на предложения, правильно расставлять знаки препинания.

Если транскрибируется диалог или разговор нескольких людей, нужно будет указывать, кто говорит. Обычно это делается путем выставления пометок типа «первый (второй) голос», «мужчина», «женщина» и других.

Если вас заинтересовал заработок на транскрибации, то для поиска работы лучшим местом являются биржи фриланса. Там практически ежедневно встречаются заказы на перевод видео и аудиофайлов в текст.

А еще начинающий фрилансер может размещать в Интернете объявления о своих услугах на тематических сайтах. Это не самый быстрый способ, но, возможно, так вам удастся заполучить клиентов для постоянной работы. Самое главное - это не писать в объявлении, что вы работаете по договорной цене. Лучше четко обозначить, какие услуги вы готовы оказать и их стоимость.

Со временем вы можете обратиться в специальные компании и предложить им свои услуги. Если вы им подойдете, у вас отпадет необходимость искать заказы. Кроме того, в таких компаниях расценки, как правило, даже больше, чем стоимость услуг, заказываемых через биржи фриланса.

Сколько можно заработать?

Не напрягаясь, в день можно траскрибировать 2 часа аудио, даже если оно самого плохого качества. На данный момент на рынке фриланс-услуг средняя цена 1 минуты перевода звука в текст составляет около 10 рублей.

При больших объемах заказа опытные транскрибаторы советуют соглашаться на более низкий тариф. Восемь рублей за 1 минуту обработки аудио при постоянной работе — вполне допустимо. Однако за заказы ниже этой ценовой планки браться не стоит, так как полученная сумма не сможет окупить затраченное время.

Предположим, вы нашли постоянного заказчика. Тогда ваш заработок, даже при цене 8 рублей за минуту транскрибации — это около 1000 рублей в день, если вы будете работать всего 2 часа. А это совсем неплохо, особенно для жителей провинции.

От чего зависит цена

Стоимость заказа на транскрибацию аудио будет выше обычной, если:

  • очень плохое качество записи и присутствуют помехи;
  • нужно «расшифровать» разговор нескольких человек, причем сложно понять, кто говорит;
  • фразы длинные и присутствуют термины, которые трудно разобрать непосвященному человеку;
  • нужно «расшифровать» текст на иностранном языке без или одновременно с его переводом (в последнем случае оплата бывает достаточно высокой);
  • требуется оформить текст специальным образом (расставить тайм-коды, сделать и другое);
  • нужно сделать работу срочно.

Как не стать жертвой недобросовестных заказчиков

Главный риск занятия транскрибацией — это недобросовестные заказчики.

К сожалению, во все времена были аферисты, желающие воспользоваться плодами чужого труда бесплатно. Особенно много их развелось в Интернете, где легко «потеряться», как только фрилансер вышлет заказ.

Выявить таких заказчиков-мошенников достаточно сложно, так как они крайне учтивы и не предъявляют завышенных требований. Основной признак «халявщика» — это высокая цена и недавняя регистрация на фриланс-бирже.

Дело в том, что горе-заказчики любят создавать аккаунты на 1-2 мошеннических заказа, которые больше никогда не используются. Что делать? Работать только с теми клиентами, которые давно на бирже фриланса, не стесняться просить предоплату. Можно также высылать заказ частями, с отдельной оплатой каждой из них. В некоторых случаях лучше поступить следующим образом: транскрибатор сначала высылает заказчику скриншот получившегося текста, а сам текст — только после получения оплаты.

Кому подходит

Прежде всего транскрибация — это хороший вариант для начинающих фрилансеров. Такой вид онлайн-заработка идеально подходит студентам и школьникам, которые ничего другого пока не имеют. Он не требует вложений и позволяет быстро начать зарабатывать.

Программы для транскрибации

Конечно, можно начать работу транскрибатором, используя любой медиапроигрыватель и текстовый редактор Word. Однако как уже было сказано, ваш доход будет напрямую связан со скоростью выполнения заказа, поэтому рекомендуется использовать специальные программы, например Express Scribe. Хотя она не имеет русскоязычной версии, разобраться с интерфейсом может каждый, кто владеет самыми примитивными навыками работы с компьютерным софтом.

К основным преимуществам программы Express Scribe относятся:

  • наличие поля для набора текста, что избавляет от необходимости постоянно переключаться между окном проигрывателя и текстовым документом;
  • возможность изменения скорости проигрывания аудиофайла;
  • наличие настраиваемых горячих клавиш, позволяющих останавливать, воспроизводить и перематывать аудиозапись.
  • адаптированность для работы с офисным редактором Word.

Неплохих результатов можно достичь, если использовать LossPlay. Эту программу, как и предыдущий софт для транскрибации, можно скачать бесплатно. Достоинства у нее почти такие же, как у Express Scribe, однако иногда вам придется переключаться между окнами, что не всегда удобно.

Теперь вы знаете, что такое транскрибация, и разбираетесь в особенностях этого

Перевод аудио в текст в модуле транскрибирования основывается на подаче звука с колонок на микрофон. Это можно достичь либо, положив микрофон к колонкам, либо посредством аудио кабеля, как физического, так и . Можно также использовать стерео микшер.

Транскрибирование звуковых файлов длинной более 15 минут относится к расширенным возможностям блокнота. За них взимается небольшая плата. Чтобы попробовать или оплатить ее, нужно зарегистрироваться на сайте и зайти в кабинет пользователя голосового блокнота (появится оранжевая ссылка).

Панель перевода аудио в текст открывается после нажатия на кнопку +Транскрибацию на главной странице сайта.

На приведенной картинке я обвел красным то что относится к этому модулю и перечеркнул, то что использовать вместе с ним не надо. То есть не нужно включать флажки вывод в буфер и интеграции . Поле Длина буфера фраз не дает накапливаться тексту в поле предварительного просмотра (актуально при использовании виртуальных или физических кабелей).

Переключатель Защита от шумов используется для борьбы с зависанием ввода в шумных видео. Хорошей альтернативой этому переключателю является установка переключателя Пауза в речи , например, в одну секунду. Переключатель Пауза в речи можно сделать видимым в настройках интерфейса кабинета пользователя.

Для загрузки видео с Youtube в модуль нужно ввести его ID.

Транскрибирование может вестись в двух режимах, зависящих от установки флажка . Когда этот флажок включен, то нажатие на кнопку включить запись одновременно включает проигрыватель, а остановить запись — останавливает его.

Весь алгоритм работы в этом случае заключается:
1) в загрузке ролика или файла в проигрыватель
2) обеспечению поступления звука с ролика на микрофон
3) Выставлению настроек, отметке флажка вставлять метки времени
3) нажатию на кнопку запуска.

Если флажок Запускать синхронно с записью не установлен то появляется панель задания времен паузы и работы.

При таком режиме кнопка включить воспроизведение запустит проигрыватель в прерывистом режиме, то есть после 5 секунд (как задано на нашем рисунке) воспроизведения он будет останавливаться на 5 секунд паузы. Кнопка же включить запись от нее не зависит. Если время паузы и время воспроизведения не установлены, то работает просто кнопка включить/отключить воспроизведение .

Такой режим может быть использован для полуавтоматического транскрибирования. При этом режиме роль виртуального аудио кабеля играет человек — он прослушивает запись в течении времени воспроизведения и надиктовывает ее в течение времени паузы.

Обработка текста после транскрибирования

Текст получаемый методом распознавания речи содержит ошибки. Для его исправления используются метки времени, полученные при транскрибировании. В этом режиме нужно также отключить флажок запускать синхронно с записью или воспользоваться горячей клавишей запуска/останова проигрывателя для расширения блокнота .

Алгоритм исправления следующий:
1) текст с метками сначала приводится к более удобному виду последовательным нажатием кнопок метки в SRТ и SRT в метки
2) выставляется флажок запуск с меток времени
2) курсор устанавливается на нужное место текста
3) с помощью горячей клавиши или с помощью кнопки включить/выключить проигрыватель прослушивается данный кусок записи (срабатывает ближайшая слева от курсора метка времени)
4) вручную или при использовании кнопок блокнота редактируется текст
5) метки убираются нажатием на кнопку убрать метки времени , или текст приводится к формату SRT (если делаются титры для Youtube)

Пакетный режим транскрибирования аудио и видео файлов

Транскрибирование аудио и видео файлов в пакетном режиме (для более чем двух файлов) относится к премиум-функциям голосового блокнота. Как и расширенные функции они доступны после оплаты в кабинете пользователя. Чтобы попробовать этот режим нужно при загрузке аудио и видео выбрать сразу несколько аудио или видео файлов, удерживая при выборе мышью клавишу Ctrl.

Обращение в техническую поддержку

При обращении в техническую поддержку. Нужно прислать четыре скриншота:

1. Экран окна блокнота (можно сделать два скриншота, если не помещается)

2. Скриншоты вкладок записи и воспроизведения звука

3. Скриншот настройки микрофона в Chrome (chrome://settings/content/microphone)

Транскрибирование аудио в автоматическом режиме

Транскрибирование методом проговаривания

Ошибки и сложности при транскрибировании