Перспективи реалізації вбудованих систем автоматичного розпізнавання мови на базі RISC-мікроконтролерів

Igor Andreevich Martynyuk

Анотація


Реалізація систем автоматичного розпізнавання мови як складової частини звукового інтерфейсу керування інформаційними інтелектуальними системами сприяє підвищенню ефективності взаємодії людини з такими системами. Особливо актуальними натепер є дослідження в галузі вбудованих систем автоматичного розпізнавання. Проаналізовано перспективи реалізації вбудованих систем автоматичного розпізнавання мови на базі високопродуктивних RISC-мікроконтролерів. Обґрунтовано переваги такої реалізації порівняно з іншими рішеннями в цій галузі. Здійснено порівняльну характеристику високопродуктивних серій мікроконтролерів. Досліджено перспективи реалізації кожного етапу задачі розпізнавання за допомогою мікроконтролерної системи.

Ключові слова


автоматичне розпізнавання мови;вбудовані системи;мікроконтролерні системи

Повний текст:

PDF

Посилання


Martynjuk I.A. Aktual'nist' ta osnovni problemy realizatsiyi tekhnolohij avtomatychnoho rozpiznavannja movy dlja vbudovanykh system / I.A. Martynjuk, V.A. Lakhno // Informatsijna bezpeka ta komp’juterni tekhnolohiyi: zb. tez dop. mizhnar. nauk.-prakt. konf., 24–25 berez. 2016 r. — Kirovohrad: KNTU, 2016. — S. 112–113.

Compact hardware liquid state machines on FPGA for real-time speech recognition [Text] / [B. Schrauwen, M. D’Haene, D. Verstraeten et al.] // Neural Networks. — 2008. — 21, № 2–3. — P. 511–523.

Speech recognition on an FPGA using discrete and continuous Hidden Markov Models [Text] / S.J. Melnikoff, S.F. Quigley, M.J. Russell // Lecture Notes in Computer Science. — 2002. — № 2438. — P. 202–211.

Pan Shing-Tai. The implementation of speech recognition systems on FPGA-based embedded systems with SOC architecture [Text] / Shing-Tai Pan, Chih-Chin Lai, Bo-Yu Tsai // International journal of innovative computing, information and control. — 2011. — 7, № 11. — P. 6161–6175.

Hu X. Isolated word speech recognition system based on FPGA [Text] / X. Hu, H. Zhang, L. Zhan et al // Journ. of Computers. — 2013. — 8, № 12. — P. 3216–3222.

Li J. Embedded speaker recognition system design and implementation based on FPGA [Text] / J. Li, D. An, L. Lang et al. // Procedia Engineering. — 2012. — 29. — P. 2633–2637.

Aldahoud A. Robust automatic speech recognition system implemented in a hybrid design DSP-FPGA [Text] / A. Aldahoud, H. Atoui, M. Fezari // International Journal of signal processing, image processing and pattern recognition. — 2013. — 6, № 5. — P. 333–342.

Bourke P.J. A Low-Power Hardware Architecture for Speech Recognition Search : thesis submitted in partial fulfillment of the requirements for the degree of Doctor of Philosophy / P.J. Bourke. – Pittsburgh, PA : Carnegie Mellon University, 2011. — 166 p.

Wei Z. Embedded system for speech recognition and image processing [Text] / Z. Wei, J. Liang // Journal of electrical and electronic engineering. — 2015. — 2, № 6. — P. 89–93.

Varshney N. Embedded speech recognition system [Text] / N. Varshney, S. Singh // International journal of advanced research in electrical, electronics and instrumentation energy. — 2014. — 3, № 4. — P. 9218–9227.

Moving Speech Recognition from Software to Silicon: the In Silico VoxProject : research report (final) : 888.012 / C.L. Edward, K. Yu, R.A. Rutenbar, C. Tsuhan. — Pittsburgh: Carnegie Mellon University, 2006. — 4 p.

Suryawanshi U.J. Hardware implementation of speech recognition using mfcc and euclidean distance [Text] / U.J. Suryawanshi, prof. dr. S.R. Ganorkar // International journal of advanced research in electrical, electronics and instrumentation engineering. — 2014. — 3, № 8. — P. 11248–11254.

Lippman R.P. An introduction to computing with neural nets [Text] / R.P. Lippman // IEEE Acoustics, speech and signal processing magazine. — 1987. — 4, № 2 — P. 4–22.

Cortex-M Series [Electronic resource]. — Access mode: http://www.arm.com/ products/ processors/cortex-m/

STMicroelectronics STM32F7 Series [Electronic resource]. — Access mode: http://www.st.com/web/en/catalog/mmc/FM141/SC1169/SS1858/

NXP Kinetis V Series [Electronic resource]. — Access mode: http://www.nxp.com/ products/microcontrollers-and-processors/arm-processors/kinetis-cortex-m-mcus/ v-series

Atmel SAM V Series [Electronic resource]. — Access mode: http://www.atmel. com/ru/ru/products/microcontrollers/arm/sam-v-mcus.aspx

Presnjakov I.N. Avtomaticheskoe raspoznavanie rechi v kanalah peredachi [Tekst] / I.N. Presnjakov, A.V. Omel'chenko, S.V. Omel'chenko // Radioelektronika i informatika. — 2002. — № 1. — S. 26–31.

Zubakov A.P. Fur'e i vejvlet-preobrazovanija v probleme raspoznavanija rechi [Tekst] / A.P. Zubakov // Vestn. Tamb. un-ta. Serija: Estestvennye i tehnicheskie nauki. — 2010. — 15, № 6. — S. 1893–1899.

Mescherjakov R.V. Struktura sistem sinteza i raspoznavanija rechi / R.V. Mescherjakov // Izvestija Tomsk. politehn. un-ta. — 2009. — № 5. — S. 121–126.

Rabiner L.R. A tutorial on hidden Markov models and selected applications in speech recognition [Text] / L.R. Rabiner // Proceedings of the IEEE. — 1989. — 77, № 2. — P. 257–286.

Alimuradov A.K. Obzor i klassifikatsija metodov obrabotki rechevyh signalov v sistemah raspoznavanija rechi [Tekst] / A.K. Alimuradov, P.P. Churakov // Izmerenie. Monitoring. Upravlenie. Kontrol'. — 2015. — № 2. — S. 27–35.


Пристатейна бібліографія ГОСТ


1. Мартинюк І.А. Актуальність та основні проблеми реалізації технологій автоматичного розпізнавання мови для вбудованих систем / І.А. Мартинюк, В.А. Лахно // Інформаційна безпека та комп’ютерні технології: зб. тез доп. міжнар. наук.-практ. конф., 24–25 берез. 2016 р. — Кіровоград: КНТУ, 2016. — С. 112–113.

2. Compact hardware liquid state machines on FPGA for real-time speech recognition [Text] / [B. Schrauwen, M. D’Haene, D. Verstraeten et al.] // Neural Networks. — 2008. — 21, № 2–3. — P. 511–523.

3. Speech recognition on an FPGA using discrete and continuous Hidden Markov Models [Text] / S.J. Melnikoff, S.F. Quigley, M.J. Russell // Lecture Notes in Computer Science. — 2002. — № 2438. — P. 202–211.

4. Pan Shing-Tai. The implementation of speech recognition systems on FPGA-based embedded systems with SOC architecture [Text] / Shing-Tai Pan, Chih-Chin Lai, Bo-Yu Tsai // International journal of innovative computing, information and control. — 2011. — 7, № 11. — P. 6161–6175.

5. Hu X. Isolated word speech recognition system based on FPGA [Text] / X. Hu, H. Zhang, L. Zhan et al // Journ. of Computers. — 2013. — 8, № 12. — P. 3216–3222.

6. Li J. Embedded speaker recognition system design and implementation based on FPGA [Text] / J. Li, D. An, L. Lang et al. // Procedia Engineering. — 2012. — 29. — P. 2633–2637.

7. Aldahoud A. Robust automatic speech recognition system implemented in a hybrid design DSP-FPGA [Text] / A. Aldahoud, H. Atoui, M. Fezari // International Journal of signal processing, image processing and pattern recognition. — 2013. — 6, № 5. — P. 333–342.

8. Bourke P.J. A Low-Power Hardware Architecture for Speech Recognition Search : thesis submitted in partial fulfillment of the requirements for the degree of Doctor of Philosophy / P.J. Bourke. – Pittsburgh, PA : Carnegie Mellon University, 2011. — 166 p.

9. Wei Z. Embedded system for speech recognition and image processing [Text] / Z. Wei, J. Liang // Journal of electrical and electronic engineering. — 2015. — 2, № 6. — P. 89–93.

10. Varshney N. Embedded speech recognition system [Text] / N. Varshney, S. Singh // International journal of advanced research in electrical, electronics and instrumentation energy. — 2014. — 3, № 4. — P. 9218–9227.

11. Moving Speech Recognition from Software to Silicon: the In Silico VoxProject : research report (final) : 888.012 / C.L. Edward, K. Yu, R.A. Rutenbar, C. Tsuhan. — Pittsburgh: Carnegie Mellon University, 2006. — 4 p.

12. Suryawanshi U.J. Hardware implementation of speech recognition using mfcc and euclidean distance [Text] / U.J. Suryawanshi, prof. dr. S.R. Ganorkar // International journal of advanced research in electrical, electronics and instrumentation engineering. — 2014. — 3, № 8. — P. 11248–11254.

13. Lippman R.P. An introduction to computing with neural nets [Text] / R.P. Lippman // IEEE Acoustics, speech and signal processing magazine. — 1987. — 4, № 2 — P. 4–22.

14. Cortex-M Series [Electronic resource]. — Access mode: http://www.arm.com/ products/ processors/cortex-m/

15. STMicroelectronics STM32F7 Series [Electronic resource]. — Access mode: http://www.st.com/web/en/catalog/mmc/FM141/SC1169/SS1858/

16. NXP Kinetis V Series [Electronic resource]. — Access mode: http://www.nxp.com/ products/microcontrollers-and-processors/arm-processors/kinetis-cortex-m-mcus/ v-series

17. Atmel SAM V Series [Electronic resource]. — Access mode: http://www.atmel. com/ru/ru/products/microcontrollers/arm/sam-v-mcus.aspx

18. Пресняков И.Н. Автоматическое распознавание речи в каналах передачи [Текст] / И.Н. Пресняков, А.В. Омельченко, С.В. Омельченко // Радиоэлектроника и информатика. — 2002. — № 1. — С. 26–31.

19. Зубаков А.П. Фурье и вейвлет-преобразования в проблеме распознавания речи [Текст] / А.П. Зубаков // Вестн. Тамб. ун-та. Серия: Естественные и технические науки. — 2010. — 15, № 6. — С. 1893–1899.

20. Мещеряков Р.В. Структура систем синтеза и распознавания речи / Р.В. Мещеряков // Известия Томск. политехн. ун-та. — 2009. — № 5. — С. 121–126.

21. Rabiner L.R. A tutorial on hidden Markov models and selected applications in speech recognition [Text] / L.R. Rabiner // Proceedings of the IEEE. — 1989. — 77, № 2. — P. 257–286.

22. Алимурадов А.К. Обзор и классификация методов обработки речевых сигналов в системах распознавания речи [Текст] / А.К. Алимурадов, П.П. Чураков // Измерение. Мониторинг. Управление. Контроль. — 2015. — № 2. — С. 27–35.





DOI: https://doi.org/10.20535/SRIT.2308-8893.2016.4.06

Посилання

  • Поки немає зовнішніх посилань.