Sistem De Conversație Bazat Pe Inteligență Artificială: 6 Steg
Sistem De Conversație Bazat Pe Inteligență Artificială: 6 Steg
Anonim
Sistem De Conversație Bazat Pe Inteligență Artificială
Sistem De Conversație Bazat Pe Inteligență Artificială

Författare: Stanut Nicolae-Radu

Grupa: 333AB

Notera: 8

Steg 1: Beskriv beskrivning

Descriere Funcțională
Descriere Funcțională

Principn principiu sistemul va fi asemănător

asistenților inteligenți pentru casă de tipul Google Assistant and Amazon Alexa, utilizatorii pot da comenzi vocale aparatului, iar acesta va răspunde sau va face of anumită acțiune, in funcție de cerințele utilizatorului. Creierul acestui dispozitiv va fi un Raspberry pi 3, datorită faptului că dispune from Wi-Fi, acest lucru permițând conectarea la serviciul cloud Amazon, care va da "inteligență" system.

Folosind -tjänsten för moln och konstgjord Amazon De exemplu acest asistent virtual poate prezenta starea meteo, poate minine minte notițe, poate pune alarme, dar din păcate (sau fericire?), Aceste lucruri depind in totalitate de Amazon, iar comenzile dispozitivului se dau in limba engleză.

Ca și obiectiv secundar, voi încerca să integrez limba română astfel încât asistentul să poată înțelege și comenzi și de la persoane necunoscătoare de limba engleză. Alt obiectiv secundar ar fi ca asistentul să ajute la automatizarea unor procese, de exemplu aprinderea și stingerea unor lumini, oprirea unei Prize. Beskrivning, öppnar API: et för Amazon kan tillåta att du kan använda det.

Sursa poză:

Steg 2: Komponent

Pentru realizarea proiectului am avut nevoie de următoarele componente:

  1. Hallon PI 3 B+

    Acest minidator för att skapa och konfigurera Linux -Debian för en ARM -processor. De asemenea, acest modell dispune și de wi-fi, conexiunea la internet fiind absolut necesară pentru motoarele de text-în-vorbire și vorbire-în-text

  2. PS Eye Camera

    Pe post microfon ("urechea proiectului") kan också användas på en stationär konsol Play Station 3 deoarece dispune de un microfon puternic cu 4 canale, fiind may ieftină decâtt on cameră web obișnuită

  3. Boxă portabilă

    Skicka en överföringsinformation för ett nytt användningsområde och en annan information

  4. 2 eld + LED
  5. Caserolă

    Carcasa proiectului, o caserolă de sarmale: D

Steg 3: Hårdvara

Hårdvara
Hårdvara

După ce am adunat componentele, am trecut la implementare, schema este una forte simpleă. Boxa portabilă se conectează la portul USB pentru alimentare și la portul jack pentru playback, camera/microfonul se conectează doors the portul USB prin care comunică with computer-ul. Am mai adăugat în schemă și led-ul conectat la pin-ul 17 cu rezistorul, pentru comanda de lumină. Nimic komplicerar.

Steg 4: Programvara

Arhitectura acestui proiect presupune un "creier" care să preia comenzi de la utilizator (voce), să transforme datele într-un format accesibil lui (text) si să le redea răspunsul sau confirmmarea unei acțiuni înapoi (voce). Pentru acestea a fost nevoie de 3 servicii separata:

  1. Un motor Speech-to-Text (STT), för en preliminär datadel för intrare (informațiile transmise de utilizator prin vorbire)
  2. Un sistem de inteligență artificială, pentru a lua decizii și a rezolva problems
  3. Un motor Text-to-Speech (TTS), för att använda en transmitter som kan användas för att bekräfta din bekräftelse

Vi kan använda STT som ett API för Google, för Google Speech API, för att ta hand om det, eller om du vill ha en konversation eller en rapport som kan ge upphov till ett antal begränsningar. Am ales acest API datorită faptului că această parte a sistemului este cea mai sensibilă la erori și cea mai supusă la perturbații. Datorită limitărilor hardware impuse de computer (putere de processare, spațiu de stocare, memorie), folosirea unui serviciu offline este exclusă, așa că am optat pentru un serviciu Cloud, oferind și o precizie mai mare, dar și un timp de răspuns mai bun, Google kan också använda en del av STT.

Återkoppling-ul oferit utilizatorului (TTS-ul) am ales un motor offline, deoarece acesta nu este forte mare consumator de resurse și nici nu este la fel de sensibil precum STT-ul. Sintetizarea vocii este făcuta de Festival Speech Synthesis System, care este oferit gratuit sub o liceță de tipul MIT. Vocea este una ușor robotică, for multi mai inteligibilă față de eSpeak, alt motor TTS offline. Avantajul său față de serviciile online este că nu are niciun fel de limitare la numărul de coversii.

Liantul dintre STT și TTS, precum și partea "iteligentă" este platforma denumită Jasper. O plattform Öppen källkod, tillgänglig för GitHub för länk-ul: https://github.com/jasperproject/jasper-client. Aceasta face legătura dintre toate serviciile descrise mai sus și ia decizii in funcție de input-ul utilizatorului. Este kompatibilă cu Raspberry PI, fiind scrisă in Python. Am ales această soluție in detrimentul celor Cloud datorită modularității, platforma permite folosirea oricărui serviciu STT și TTS, dar și definirea oricărei acțiuni folosind limbajul de programare Python.

Systematiskt konstgjorda system är en procedurmässig, men jag kan välja mellan olika typer av systeminlärning av maskininlärning (chatbot). Natura platformei Jasper, som kan användas som en fördefinierad, begränsad kapacitat för konvertering, eller för att kunna leverera ett unikt digitalt format, så att vi kan hitta ett omfattande projekt.

Steg 5: Implementera

  1. Jag installerar ett operativsystem för Raspbian -kort för microSD
  2. Am conectat camera și difuzorul la Hallon
  3. I konfigurat system för operering, după vård am installat toate bibliotecile och serviciile necesare, urmând toți pașii din acest ghid:
  4. Skapar och installerar jag modulen för att kunna utvidga funktionaliteten

Steg 6: Använd

Image
Image
Används
Används
Används
Används

Din läsare kan övervaka en konfiguration som gör att en trådlös fördefinierad, kontrollerbar SSI kan konfigureras. Jasper tillåter interaktiva interaktioner:

  1. Prin terminal (text) - la rularea comenzii jasper_cli
  2. Prin voce - la rularea comenzii jasper

Din förenkla voi începe demonstrarea funcționalității prin intermediul terminalului. La rularea comenzii jasper_cli va fi afișat un mesaj de întâmpinare, iar Jasper este gata să primească comenzi. Skriv ut komenzile cunoscute se numără:

  • DEFINE + cuvânt - întoarce definiția din dicționar a cuvântului respectiv
  • VEM, VAD, HUR MYCKET, HUR MÅNGA, HUR GAMMEL + cuvânt - folosește API -ul wolframalpha pentru a răspunde la întrebări generale
  • WIKI - folosește API -ul de la wikipedia pentru a oferi informații despre diferite noțiuni
  • JOKE - spune o glumă
  • LUMOS/NOX - aprinde/stick LED -ul atașat
  • TRIVIA
  • FILMER - informații despre film (IMDB)
  • NYHETER - citește știri

Moduln modul voce, deschis la introducere comenzii "jasper" în linia de comandă, dispozitivul se pune in modul de așteptare, acesta fiind trezit la auzirea unui cuvânt-cheie. În cazul de față cuvâtul cheie este "Jasper". După ce dispozitivul a auzit cuvântul cheie, acesta intră in modul de ascultare, putând să primească comenzi exact ca și în modul text. După executarea comenzii, dispozitivul intră din nou in așteptare până la o nouă trezire a sa.

Rekommenderad: