|
Вопрос # 4 074/ вопрос открыт / |
|
Здравствуйте!
Хочу написать приложения для записи текста под диктовку(Express Dictate не понравился :) ) только не знаю с чего начать. Можете что нибудь "путёвое" подсказать?
СПС большое!
 |
Вопрос задал: padonak (статус: Посетитель)
Вопрос отправлен: 21 апреля 2010, 22:16
Состояние вопроса: открыт, ответов: 0.
|
Мини-форум вопроса
Всего сообщений: 6; последнее сообщение — 22 апреля 2010, 16:54; участников в обсуждении: 2.
21 апреля 2010, 22:46: Вопрос перемещён из тематического раздела Delphi » Общие вопросы по программированию в раздел Delphi » Мультимедийные приложения модератором Ерёмин А.А.
|
Вадим К (статус: Академик), 22 апреля 2010, 00:04 [#1]:
Распознавание голоса - сложная задача. Институты работают Хотя, может Вам и повезет.текста
Для начала неплохо изучить базовый курс математики, понимать что такое интегралы, вэйвлеты, преобразование фурье, а там уже будет видно
Галочка "подтверждения прочтения" - вселенское зло.
|
|
padonak (статус: Посетитель), 22 апреля 2010, 07:33 [#2]:
Допустим я изучу эти интегралы, выйвлеты... мы вернёмся к этому вопросу?
|
|
Вадим К (статус: Академик), 22 апреля 2010, 10:23 [#3]:
Вы думаете, что я обладаю тайными знаниями алгоритмов, которые позволят безошибочно декодировать голос? Нет, иначе я был бы в списке 100 богатейших
Но "изучить одни интегралы" может понадобиться несколько десятков лет (я говорю не о том, что бы помнить, как записывается значек интеграла, а понимать это все). Плюс есть ещё много чего.
Галочка "подтверждения прочтения" - вселенское зло.
|
|
padonak (статус: Посетитель), 22 апреля 2010, 15:20 [#4]:
Плюс есть ещё много чего. >>> Как я понимаю, в ближайшие 5 лет с моими знаниями туда соваться не стоит...
|
|
Вадим К (статус: Академик), 22 апреля 2010, 15:31 [#5]:
Ну... может Вам удастся придумать чудный алгоритм. И там не нужно будет высшей математики. Все ведь не так просто
Если задача распознавания голоса интересна, то наверно путь становления будет такой (к сожалению возраста не знаю, поэтому рисую на глаз )
- выучить английский (можно ещё немецкий/японский) - без хороших лингвистических познаний сложно расшифровывать голос.
- закончить хороший вуз по специальности прикладная математика или что то близкое к этому.
- поискать институт, который этим занимается (тут ещё раз пригодиться знание языков).
P.S. недавно читал статью, где группа ученых говорит о том, что человек при анализе голоса также использует методику чтения по губам. То есть, можно говорить очень тихо, но собеседник все равно услышит - он смотрит на губы и подсознательно "читает" с них. Они даже делают жестокий эксперимент - человек говорит одно, но его голос заменили другим. Человек который смотрит видео и пытается понять что говориться слышит совершенно третье. Но достаточно закрыть глаза, как все слышится верно... Возможно по этой причине, когда мы смотрим иностранные фильмы с дубляжем, они нам иногда кажутся сухими. А в оригинале - чудными.
Галочка "подтверждения прочтения" - вселенское зло.
|
|
padonak (статус: Посетитель), 22 апреля 2010, 16:54 [#6]:
Ого... Ну ладно, сдам экзамены и вперёд... Может и получится что нибудь...
|
Чтобы оставлять сообщения в мини-форумах, Вы должны авторизироваться на сайте.
|