Spraakherkenning met behulp van Google Speich API en Python: 4 stappe

INHOUDSOPGAWE:

Stap 1: ReSpeaker USB 4-Mic Array
Stap 2: Installeer vereiste biblioteke
Stap 3: Teks-na-spraak in Python With Pyttsx3 Library
Stap 4: Alles saamvoeg: Spraakherkenning bou met Python met behulp van Google Speech Recognition API en Pyttsx3 Library

2025 Outeur: John Day | [email protected]. Laas verander: 2025-01-23 12:53

Spraakherkenning

Spraakherkenning is 'n deel van Natural Language Processing, wat 'n subveld van kunsmatige intelligensie is. Om dit eenvoudig te stel, spraakherkenning is die vermoë van 'n rekenaarprogrammatuur om woorde en frases in gesproke taal te identifiseer en om te skakel in menslike leesbare teks. Dit word gebruik in verskillende toepassings, soos stemassistentstelsels, tuisautomatisering, stemgebaseerde chatbots, stem -interaksie -robot, kunsmatige intelligensie, ens.

Daar is verskillende API's (Application Programming Interface) om spraak te herken. Hulle bied gratis of betaalde dienste aan. Hierdie is:

CMU Sfinx
Spraakherkenning deur Google
Google Cloud Speech API
Wit.ai
Microsoft Bing -stemherkenning
Houndify API
IBM spraak tot teks
Snowboy Hotword Detection

Ons sal Google spraakherkenning hier gebruik, aangesien dit geen API -sleutel benodig nie. Hierdie handleiding is daarop gemik om 'n inleiding te gee oor hoe u die Google Speech Recognition-biblioteek op Python kan gebruik met behulp van 'n eksterne mikrofoon, soos ReSpeaker USB 4-Mic Array van Seeed Studio. Alhoewel dit nie verpligtend is om 'n eksterne mikrofoon te gebruik nie, kan selfs 'n ingeboude mikrofoon van 'n skootrekenaar gebruik word.

Stap 1: ReSpeaker USB 4-Mic Array

Die ReSpeaker USB Mic is 'n viermikrofoon-toestel wat ontwerp is vir AI- en spraaktoepassings, wat deur Seeed Studio ontwikkel is. Dit het 4 hoëprestasie, ingeboude omnidirectionele mikrofone wat ontwerp is om u stem vanaf enige plek in die kamer op te neem en 12 programmeerbare RGB LED-aanwysers. Die ReSpeaker USB -mikrofoon ondersteun Linux-, macOS- en Windows -bedryfstelsels. Besonderhede kan hier gevind word.

Die ReSpeaker USB Mic kom in 'n mooi pakket met die volgende items:

'N Gebruikersgids
ReSpeaker USB -mikrofoonreeks
Mikro -USB na USB -kabel

Ons is dus gereed om te begin.

Stap 2: Installeer vereiste biblioteke

Vir hierdie tutoriaal neem ek aan dat u Python 3.x gebruik.

Kom ons installeer die biblioteke:

pip3 installeer SpeechRecognition

Vir macOS moet u eers PortAudio met Homebrew installeer en dan PyAudio met pip3 installeer:

brou installeer portaudio

Ons loop onder die opdrag om pyaudio te installeer

pip3 installeer pyaudio

Vir Linux kan u PyAudio installeer met apt:

sudo apt-get install python-pyaudio python3-pyaudio

Vir Windows kan u PyAudio met pip installeer:

pip installeer pyaudio

Skep 'n nuwe python -lêer

nano get_index.py

Plak op get_index.py onder die kodefragment:

invoer pyaudio

p = pyaudio. PyAudio () info = p.get_host_api_info_by_index (0) numdevices = info.get ('deviceCount') vir i in range (0, numdevices): if (p.get_device_info_by_host_api_device_index (0, i). '))> 0: druk ("Invoertoestel -ID", i, " -", p.get_device_info_by_host_api_device_index (0, i).get (' naam '))

Voer die volgende opdrag uit:

python3 get_index.py

In my geval gee die opdrag die volgende uitvoer na die skerm:

Invoertoestel -ID 1 - ReSpeaker 4 Mic Array (UAC1.0)

Invoertoestel -ID 2 - MacBook Air -mikrofoon

Verander device_index na indeksnommer volgens u keuse in die onderstaande kodefragment.

voer spraakherkenning in as sr

r = sr. Recognizer () speech = sr. Microphone (device_index = 1) met toespraak as bron: druk ("sê iets! …") audio = r.adjust_for_ambient_noise (bron) audio = r.listen (bron) probeer: herhaal = r.recognize_google (klank, taal = 'en-US') druk ("U het gesê:" + herken) behalwe sr. UnknownValueError: print ("Google spraakherkenning kon nie klank verstaan nie") behalwe sr. RequestError as e: print ("Kon nie resultate van Google Spraakherkenningsdiens aanvra nie; {0}". Formaat (e))

Toestelindeks is 1 gekies as gevolg van ReSpeaker 4 Mic Array sal die hoofbron wees.

Stap 3: Teks-na-spraak in Python With Pyttsx3 Library

Daar is verskeie API's beskikbaar om teks na spraak in python om te skakel. Een van sulke API's is die pyttsx3, wat na my mening die beste teks-na-spraak pakket is. Hierdie pakket werk in Windows, Mac en Linux. Gaan die amptelike dokumentasie na om te sien hoe dit gedoen word.

Installeer die pakket Gebruik die pip om die pakket te installeer.

pip installeer pyttsx3

As u in Windows is, benodig u 'n ekstra pakket, pypiwin32, wat u benodig om toegang te verkry tot die inheemse Windows -spraak -API.

pip installeer pypiwin32

Skakel teks na spraak python script Hieronder is die kodefragment vir teks na spraak met behulp van pyttsx3:

voer pyttsx3 in

enjin = pyttsx3.init ()

engine.setProperty ('koers', 150) # Spoedpersentasie

engine.setProperty ('volume', 0,9) # Volume 0-1

engine.say ("Hallo, wêreld!")

engine.runAndWait ()

Stap 4: Alles saamvoeg: Spraakherkenning bou met Python met behulp van Google Speech Recognition API en Pyttsx3 Library

Die onderstaande kode is verantwoordelik vir die herkenning van menslike spraak met behulp van Google spraakherkenning en die omskakeling van die teks in spraak met behulp van die pyttsx3 -biblioteek.

voer spraakherkenning in as sr

invoer pyttsx3 engine = pyttsx3.init () engine.setProperty ('rate', 200) engine.setProperty ('volume', 0.9) r = sr. Recognizer () speech = sr. Microphone (device_index = 1) met spraak as bron: audio = r.adjust_for_ambient_noise (bron) audio = r.listen (bron) probeer: recog = r.recognize_google (klank, taal = 'en-US') druk ("Jy het gesê:" + herken) engine.say (" U het gesê: " + herken) engine.runAndWait () behalwe sr. UnknownValueError: engine.say (" Google spraakherkenning kon nie klank verstaan nie ") engine.runAndWait () behalwe sr. RequestError as e: engine.say (" Kon nie versoek resultate van Google Spraakherkenningsdiens; {0} ". formaat (e)) engine.runAndWait ()

Dit druk die uitvoer op die terminaal uit. Dit sal ook in spraak omskep word.

U het gesê: Londen is die hoofstad van Groot -Brittanje

Ek hoop dat u nou 'n beter begrip het van hoe spraakherkenning in die algemeen werk, en die belangrikste is hoe u dit kan implementeer met behulp van Google Speech Recognition API met Python.

As u enige vrae of terugvoer het? Gee 'n opmerking hieronder. Bly ingeskakel!

Aanbeveel:

Beheer oor die hele wêreld met behulp van internet met behulp van Arduino: 4 stappe

Beheer oor die hele wêreld met behulp van internet met behulp van Arduino: Hallo, ek is Rithik. Ons gaan 'n internetbeheerde LED maak met u telefoon. Ons gaan sagteware soos Arduino IDE en Blynk gebruik. Dit is eenvoudig, en as u daarin geslaag het, kan u soveel elektroniese komponente beheer as wat u wil

Monitor versnelling met behulp van Raspberry Pi en AIS328DQTR met behulp van Python: 6 stappe

Monitering van versnelling met behulp van Raspberry Pi en AIS328DQTR Gebruik van Python: Versnelling is eindig, volgens ek volgens sommige wette van die fisika.- Terry Riley 'n Jagluiperd gebruik ongelooflike versnelling en vinnige spoedveranderinge wanneer hy jaag. Die vinnigste wesens aan wal gebruik af en toe sy hoogste tempo om prooi te vang. Die

Bou 'n weer -dashboard met behulp van Dark Sky API: 5 stappe (met foto's)

Bou 'n weer -dashboard met behulp van Dark Sky API: Dark Sky spesialiseer in weervoorspelling en visualisering. Die coolste aspek van Dark Sky is hul weer -API wat ons kan gebruik om die weerdata van byna oral ter wêreld op te haal. Dit is nie net reënerig of sonnig nie, maar temperatuur

Bywoningstelsel met die stoor van data op Google -sigblad met behulp van RFID en Arduino Ethernet Shield: 6 stappe

Bywoningstelsel met die stoor van data op Google -sigblad met behulp van RFID en Arduino Ethernet Shield: Hallo ouens, hier kom ons met 'n baie opwindende projek, en dit is hoe om rfid -data na Google -sigblad te stuur met behulp van Arduino. Kortom, ons gaan 'n bywoningsisteem maak wat gebaseer is op rfid -leser, wat die bywoningsdata intyds sal stoor om te gaan soek

Google Vision API met behulp van Raspberry Pi en Node: 11 stappe

Google Vision API met behulp van Raspberry Pi en Node: Dit is 'n begingids vir die gebruik van die Google Vision API. Dit gebruik die volgende Raspberry Pi Zero W Arch Linux NodeJS internetverbinding Ken u nie Arch Linux nie? Of hoe om 'n Raspberry Pi op te stel? Moenie bekommerd wees nie, ek het 'n reeks artikels geskryf wat

Spraakherkenning met behulp van Google Speich API en Python: 4 stappe

INHOUDSOPGAWE:

Spraakherkenning

Stap 1: ReSpeaker USB 4-Mic Array

Stap 2: Installeer vereiste biblioteke

Stap 3: Teks-na-spraak in Python With Pyttsx3 Library

Stap 4: Alles saamvoeg: Spraakherkenning bou met Python met behulp van Google Speech Recognition API en Pyttsx3 Library

Aanbeveel:

Beheer oor die hele wêreld met behulp van internet met behulp van Arduino: 4 stappe

Monitor versnelling met behulp van Raspberry Pi en AIS328DQTR met behulp van Python: 6 stappe

Bou 'n weer -dashboard met behulp van Dark Sky API: 5 stappe (met foto's)

Bywoningstelsel met die stoor van data op Google -sigblad met behulp van RFID en Arduino Ethernet Shield: 6 stappe

Google Vision API met behulp van Raspberry Pi en Node: 11 stappe

Google Home Mini Aux Jack Mod: 9 stappe

PC -kragbron vir 12v 3D -drukker: 5 stappe

Lewende LED: 6 stappe

Veranderlike laboratoriumbankvoeding!: 6 stappe (met foto's)

Maak 'n DSLR -houer vir minder as 6 $ met behulp van PVC -pype (monopod/driepoot vir enige kamera): 6 stappe

Tic Tac Toe (3 in 'n ry): 10 stappe (met foto's)

3D Tic-Tac-Toe op 'n Led Cube: 11 stappe

RGB -beheerder vir motorfiets: 8 stappe

Hoe u dokumente in 'n Office 365 SharePoint -biblioteek kan oplaai en hernoem: 8 stappe

Listrik L585 585Wh AC DC draagbare kragtoevoer: 17 stappe (met foto's)

Hondestemmingsdetektor (Framboos Pi): 5 stappe

DIY mini -oscilloskoop: 13 stappe

Minecraft gebaarbeheerder: 10 stappe (met foto's)

Hawking 7dBi Wifi Antenna Free Boost: 4 stappe

Geheime spioenfoto -kopie -bondellêer: 5 stappe

Muzak Visualizer: 9 stappe