Мамлекеттик Of Linux Үн таануу

тааныштыруу

Мен макаланын изилдөө көп убакыт жана өтө көп, мен жалпы бекетинен же чыгып жатканда жана тууралуу жүрүп жаткан макаланын темасы жөнүндө ойлонуп көр.

Бир күнү кечинде жумуштан участкасында 1,5 чакырым жүргөн маалда мен: "Эгер мен айткым келген жаздыруу мүмкүн болсо, андан кийин мен өзгөртүү жана үлгүдөгү мүмкүн текст делосуна жазуусу себеп болгон туура эмес болмок", деп ойлоду .

Мен көп саат бою ар кандай жолдор менен түздөн-түз Linux менен Буйрутма программасын колдонгон Наушник аркылуу жазуу, анын ичинде үн таануу жана жазуу үчүн жеткиликтүү карап, MP3 же WAV үлгүдөгү билэни эсепке алуу жана буйрук сабы аркылуу аны өзгөртүү, ошондой эле Chrome аркылуу сарптаган жана Android колдонмолор.

Бул макалада оор эмгек күндөн кийин жыйынтыктарын белгилейт.

Linux Options

Linux-жылы жаздырса жана үн таануу программаны табуу үчүн аракет кылып, ал ошондой эле мүмкүн эмес болушу мүмкүн жана колдо болгон тандоолор деген акылдуу эмес.

Бул Wikipedia бет CMU Sphinx, Улий жана Шымон, анын ичинде мүмкүн болгон жолдору тизмеси бар.

Мен азыр Debian тестирлөөнүн негизинде SparkyLinux колдонуп жатам жана сактоочу-жылы гана үн таануу пакет Sphinx деп айта алам.

эне Linux программалар мен аракет аяктады сиз Наушник түз жазып берет, мен WAV материалдары бир код тиркеме текстин жана Freespeech-VR динин үчүн колдонулган PocketSphinx болгон.

Мен да VoiceNote II жана Dictanote ичинде Chrome колдонмолорунун бир нече аракет жасашкан.

Акыр-аягы, мен "Dictation жана Email" жана "Talk жана Talk Dictation" Android колдонмолорун аракет кылышкан.

Freespeech-VR

Freespeech-VR-стандартты, сактоочу жеткиликтүү эмес. Мен бул жерден жүктөгөн.

индекс делосуна мазмунун жүктөө жана казып кийин Мен терминал ачылган жана өздүк чыгарылды куржунга бороз салып.

Мен freespeech-VR ачуу үчүн төмөнкү буйрукту терилген.

Sudo Пайтон freespeech-VR

Мен өтө татыктуу Наушник жана кыйла ачык-айкын түштүк англис тилинде плейер бир жубу бар.

төмөнкү текст freespeech-VR терезесинен көрүндү:

Тесттер башкарылган менен кантип камсыз кылуу жыйынтыгы бүгүн бирдиги иттерге Кош качан үчүн текст система жолу сөз мен бири үчүн бир гана болуу үмүт үчүн болгон жана система катары алтын, бир тоок каражаттарды колдонот сынаш керек Ea менин ысмым кийинки ofch чалуулар бул Бул билэни Жакында жетиштүү эпчил мейкиндиктин бир учурларда аппаратты Sphinx Бул туулгандыгы бөлүштү үйрөтүлгөн мүмкүн эмес, ошондой эле куралдар Сай а Акыркы бир сааты колдонуп бүткөндөн кийин сүйлөгөн пайдаланууну окуя болгон жана ал сиз сыяктуу бул Linux абдан кандай ийгилик алыс болгондо менен колдонуу

Мен ушул Алтын тоок менен эч сөз Dogs сайт Of Unit эмес жана эч кандай учурда кылган азыр айткым келет. Мен үн таануу үчүн программалык каражаттарды пайдалануу менен жараянын сүрөттөө үчүн аракет кылды.

Программамды чайыр жана ылдамдыгын ар кандай, анын ичинде бир нече жолу аракет кылып, бирок так начар эле.

PocketSphinx

PocketSphinx бир WAV билэни алып, буйрук Сызыкты колдонуу текстин түшүрүп, аны кайра алат.

PocketSphinx Debian сактоочу аркылуу жеткиликтүү жана бөлүштүрүү үчүн жеткиликтүү болууга тийиш.

Мен PocketSphinx менен табылган негизги көйгөй дээрлик үн таануу, тил картотекалар, сөздүктөр жана системаны кантип окутуп-үйрөтүүгө түшүнүктөр бир даражасы керек.

PocketSphinx орнотуу кийин CMU Sphinx сайтына барып, мүмкүн болушунча көп маалымат окуп берүүгө тийиш. Ошондой эле төмөнкү үлгү билэни жуктоп алыш керек.

(Эгер жок болсо, ал англис тилин сага ылайыктуу тил моделин тандап).

жалпы PocketSphinx жана Sphinx документтешитирүү карапйым адамдар үчүн эмес, мен кандай сөздүк документ чыгып калышы мүмкүн түшүнүүгө кыйын болгон, мүмкүн болгон сөздөр жана тил моделдин тизмесин көрсөтүү үчүн колдонулат мүмкүн айтылыш тизмеси бар.

PocketSphinx сынаш үчүн мен өз ордума, өз үнүн бир жазууну колдонгон, "Devils жактоочусу" деген Хэршлаг тартып үзүндүсүн жана "Морган Freeman" деген үзүндүсүн. Бул пункт катары айкын Морган Freeman катары бир окуяны айтып берет ар түрдүү үндөр, ошондой эле мен үчүн эч ким жок аракет болгон жана эч ким ал Пачино дага бир сапты куткарат.

PocketSphinx иштөө үчүн бир WAV билэни жана белгилүү бир түрдө болушу керек керек. билэ MP3 түрдө болсо WAV түрдө айландырышат ffmpeg буйрукту колдоносуз:

ffmpeg -i inputfilename.mp3 -acodec pcm_s16le -ar 16000 outputfilename.wav

PocketSphinx төмөнкү буйрукту колдоносуз иштетүү үчүн:

pocketsphinx_continuous -dict /usr/share/pocketsphinx/model/lm/en_US/cmu07a.dic -infile voice2.wav -lm cmusphinx-5.0-ан-us.lm 2> voice2.log

pocketsphinx_continuous бир WAV билэни алат жана текстин аны айлантат.

pocketsphinx жогору буйругу "/usr/share/pocketsphinx/model/lm/en_US/cmu07a.dic" тил моделге "cmusphinx-5.0-ан-us.lm" деп аталган бир сөздүк билэ айтып жатат да. билэ voice2.wav деп аталат текстин жолдоп жатышат (мен үнү менен бир эсепке алуу болуп саналат). Акыр-аягы, 2> сен сөзсүз билэ салып кереги жок деп voice2.log баары дайын өндүрүүнү артылат. сыноонун чыныгы жыйынтыгы терминалдык терезенин ичинде көрсөтүлөт.

Менин үнүмдү колдонуп натыйжасы болуп төмөнкүлөр саналат:

жөнүндө, ошондой эле эч бир ушул аптада баш тосуп бир мүнөттө кайсы таануу программасы жөнүндө

freespeech-VR менен натыйжалары коркунучтуу эмес, бирок дагы эле турак эмес. Мен анда Ал Пачино менен PocketSphinx колдонуу менен аракет кылган, бирок бул эч кандай натыйжа берген жок.

Акыр-аягы, мен Морган Freeman үнүн тасманын "Bruce Алла Таала" жана бул жерде жыйынтыктарын колдонуп аракет кылып:

000000000: биз анын үстүнө да ошентем
000000001: баары катуу ооба азыр ооба бул тирүү болгон көпчүлүк болгон күнү мен ысык-нын бир бөлүгү эмесмин жатышат
000000002: бейсбол саат бир аз чыгып турган ачкыч үрөнүн же жашоосуна чейин жетпейт, эмне кыларыбызды билбейбиз
000000003: калыбына адамдар кандай
000000004: алар жазган эмес
000000005: туура, мага да
000000006: Эгер керек эрежелери
000000007: мен сени күтүп жаткам
000000008: Ал мисал өлтүргүч Колдун тарап болуп калган бул жерде билдим
000000009: кычкылтекти жазууга жол бири экен. эшек мен ар дайым бири-кийип аз ойлонуп,
000000010: сиз мен дүйнөдө эмесмин үйлөр жана мен көргөн деп ойлойм баары эмес, качан маселе бириккен Ал жакшы мен ошол учурда аларды бааланган жатам бербей калат + окшош деп
000000011: аны бар ата
000000012: Бул жөнүндө эмне көп
000000013: экенин эске албайт
000000014: Силерге өкчөмө таш боюнча тиешеси жок адамдар баары
000000015: күзүндө укугу
000000016: ошондой эле мен үчүн жөн гана кармап
000000017: ал ошол үй-бүлө менен баары болот деген үчүн бара жатабыз деп да мен ойлойм, анда бактысыз, биз мен жол айырмаланып жагабы жок болчу

Менин тест дээрлик илимий каралышы мүмкүн жана PocketSphinx иштеп туура программалык каражаттарды пайдалануу менен эмес, деп алат. жакшы сөздүктөр жана тил документ түзүү үчүн пайдаланылышы мүмкүн үн окутуу деген ыкма бар.

Менин башкы пикир да, ал жөн гана өтө оор стандарттык Күнүмдүк колдонуу үчүн абдан маанилүү болуп эсептелет.

VoiceNote II

VoiceNote II Google Үн таануу API колдонгон Chrome колдонмо болуп саналат.

Сиз Chrome же Chromium браузерлерге колдонуп жаткан болсо, силер аркылуу VoiceNote II орното алат Желе дүкөнү .

VoiceNote II жөнүндө сүрөтчөлөр Бирок жазуу баскычын жогорку оң абалда турат, ал эми терезеде, түзөтүү баскычын түбүндө да түбүнө тилин орнотуу үчүн керек эле башка ыкмада алып коюп жатышат.

эмне керек биринчи тилди тандап жана бул дүйнөнүн сөлөкөтүн чыкылдатуу аркылуу жетишүүгө болот.

Жазууну баштоо үчүн иштебейт уясынын белгисине жана Наушник кирип сүйлөшүп башташат. Мен сүйлөп ашык Мыкты натыйжаларды алуу үчүн жай негизги эле программа түзүү үчүн мүмкүнчүлүк бар деп.

Төмөндө көрүүгө болот эле ийгиликтүү болгон эмес:

Hello, туташуу үчүн жылуу. About.com кыскача макалалар 2008 текст өзгөртүү dunelm Адамс тёмёндёёсънё оодаруу эле үн жана ал тандаган келсе эле, мыкты жолун мен үн текст Адондон, аны ачык текст сөз 2014debian же об топтом ачык үнү түрүн көрсөтүп табылган колдоого деди Эдинбург French German сизге жакшы itsuccess текст делосуна катары текстти Англия үчүн мыкты түштүк абдан типтүү англисче басым, бирок мен textvia бул torrentalong жатам жазып бүткөндө microphonewhat жээгинде бириккен kingdomstart убакыт алуу менен тандап алган иш жүзүндөгү документ менен жана listeningfriends үчүн makethank каталар үчүн көрө аласыз

Dictanote

Dictanote башка Chrome App диктант максаттар үчүн пайдаланылышы мүмкүн болгон жана алда канча туюмдуу деп таап, ал эми жыйынтыктар VoiceNote II караганда жакшы эмес болчу.

Мен бир гана жаңы документтерди түзүү алдын Dictanote жана демо нускасын колдонулган, бирок сиз редактор мурунтан эле текстти сүйлөшө берет. Мен үн таануу сынап алган, бирок жыйынтык VoiceNote II артык эмес болчу, ошондуктан мен про чыгаруу үчүн кол койгон эмесмин.

Жат жазуу жана почта

"Жат жазуу жана почта" эне Google үн таануу API колдонгон Android колдонуу болуп саналат.

"Жат жана Почтасы" айынан ушул күнгө чейин аракет башка программа болбосун алда канча жакшы экен.

салам жөнүндө Linux үчүн саламдашуу., бүгүн биз текст добушун айландыруу тууралуу сөз

"Жат жана Почтасы" менен куулук жай сүйлөп, андан да басым менен, ошондой эле мүмкүн болушунча pronunciate болуп саналат.

Сиз менен сүйлөшүп бүткөндөн кийин, сиз менен жыйынтыктарды электрондук кат алат.

Жана сүйлөшүү Talk диктант

Мен аракет кылдым башка Android Application "Talk жана Talk диктант" болчу.

Бул колдонмо холбуурун шагы мыкты жана үн таануу, чынында эле, жакшы иштеген. жаздырса жазып кийин электрондук почта аркылуу, анын ичинде ар кандай жолдор менен жыйынтыгын алган.

Бүгүн about.com Linux үчүн кабыл биз текст сөз айландыруу жөнүндө айтып жатасыз

Текст көрүп тургандай, жогоруда эгер ала турган мүмкүн тууралуу ачык-айкын болуп калды. жай Talking ачкычы болуп саналат.

Жыйынтык

Native Linux таанууну жана атайын жаздырса үн карата менен барып, бир нече жолу бар. Google Voice API колдонгон кээ бир колдонмолор бар, бирок алар азырынча сактоочу көрсөтүлгөн эмес.

ChromeOS арыз бир аз жакшыраак, бирок алда канча мыкты жыйынтык Менин Android колдонуп жетишилген. Балким, тел жакшы коелу бар жана ошондуктан үн таануу программалык кайра жакшы мүмкүнчүлүк бар.

үн таануу чынында жарактуу болуу үчүн талап кылынган кеминде орнотуу менен сезимтал болушу керек. аны орундоо үчүн Сиз тил моделдер жана сөздүктөр менен колдун кереги жок керек.

баары уйлонсом дүйнө жүзү боюнча жүздөгөн тилдерде жөнүндө ойлобой деле бир өлкөдө ар түрдүү үн жана облуста көп диалектилери бар, анткени, мен үн таануу бүт искусство өтө кыйын экенин да баалайбыз.

Менин талдоо, ошондуктан, ал үн таануу программасы дагы деле иштеп жатат.