html5 - recognition - Chrome에는 "x-webkit-speech"입력 요소에 대한 음성 인식 기능이 내장되어 있습니까?




web speech api safari demo (7)

Chrome은 Google 서버를 통해 음성 인식을 수행합니다. 그러나 다른 브라우저가이를 다르게 구현할 이유가 없습니다 (예 : OS의 일부 음성 인식 기능 사용).

발루, 너의 링크는 실제로 약간 구식이야. 최신 Google 제안은 http://www.w3.org/2005/Incubator/htmlspeech/2010/10/google-api-draft.html 에서 찾을 수 있습니다 http://www.w3.org/2005/Incubator/htmlspeech/2010/10/google-api-draft.html

음성 인식은 Chrome 개발자 채널에서 사용할 수 있지만 아직 출시되지 않았으며 출시시기는 아직 확실하지 않습니다. 우리는 사람들이 API로 게임하고 의견을 제공하기를 바랍니다. 그러나 아직 주요 시간대에는 준비가되어 있지 않습니다.

나는 어떻게 궁금 하네.

<input type="text" x-webkit-speech speech />

Chrome에 음성 인식 기술이 내장되어 있거나 운영체제의 기본 음성 인식 기능에 액세스하고 있습니까?


x-speex-with-header-byte MIME 바이너리 형식을 인코딩 할 수있는 speexenc의 실험용 포크가 있습니다.이 바이너리 형식은 QXIP Wiki 에서 참조되었으며 GitHub 사용할 수 GitHub . 패킷의 첫 번째 바이트로 프레임의 크기를 배치하여 작업을 잘 수행합니까?


예, Chrome에는 WebKit을 통한 내장 된 음성 지원 기능이 있습니다. Google 홈페이지 (검색 창 오른쪽에 마이크가 있음)를 살펴보십시오. Chrome 팀이 검색 주소창 음성 지원을 담당하고 있다면 궁금합니다. 결국 Chrome은 WebKit 기반 브라우저입니다!


음성 인식은 Google의 제안입니다. https://docs.google.com/View?id=dcfg79pz_5dhnp23f5

이 기능은 Chrome 8 이상과 함께 제공되며 실제 인식을 수행하기 위해 데이터를 Google 서버로 보내는 것처럼 보입니다.


코드에 따라 POST 요청으로 오디오 데이터를 보냅니다.

https://www.google.com/speech-api/v1/recognize?client=chromium&lang=??&lm=??&xhw=??&maxresults=3

lm 은 코드의 grammar 이고, xhw 는 주석에 따라 선택 사항 인 hardware_info 입니다. 오디오는 speex, x-speex-with-header-byte로 나타납니다.

// Encode the frame and place the size of the frame as the first byte. This
// is the packet format for MIME type x-speex-with-header-byte.

그것은 자신의 응용 프로그램에서 사용하는 크롬 코드를 수정하는 것은 꽤 사소한 것처럼 보입니다.

최신 정보:

또한 음성 인식 API 키 를 받아야하며 하루에 50 개의 요청 으로 제한됩니다 . 그 한도를 높이는 방법은 없습니다 - 지불하는 것조차도 아닙니다.


크롬 크롬 48에서이 사실을 확인했습니다.






speech-recognition