ASSIST - česky hlasem ovládat domácího asistenta

Odpovědět
strjan
Pokročilý
Pokročilý
Příspěvky: 170
Registrován: 13. červenec 2023, 16:04
Dal poděkování: 12 poděkování
Dostal poděkování: 3 poděkování

Re: ASSIST - česky hlasem ovládat domácího asistenta

Příspěvek od strjan »

kiklhorn píše: 24. říjen 2023, 21:10 Frameworky, chyby, mikrofony (proč to s jedním mikrofonem nikdy dobře fungovat nebude), ESP, Raspberry(linux obecně), zpracování audia - zkusím do toho vnést alespoň trochu světla.
Super shrnuti, dik :-)
Jak se divas na pouziti mikrofonu pro konferencni hovory, treba tohle? https://www.alza.cz/audio-technica-atr4 ... 856922.htm

Uživatelský avatar
Pete30
Moderátor
Moderátor
Příspěvky: 2901
Registrován: 30. září 2020, 20:33
Dal poděkování: 152 poděkování
Dostal poděkování: 319 poděkování

Re: ASSIST - česky hlasem ovládat domácího asistenta

Příspěvek od Pete30 »

strjan píše: 26. říjen 2023, 14:23
Pete30 píše: 22. říjen 2023, 23:30 Na čem ti to běží a jaké jsou poznatky ?
Rozchodil jsi to na tom Rpi + mic ?
Jo, "rozchodil". Nekde vysse jsem to popisoval. Zatim jsem nenabyl dojmu, ze by to byla tak raketova veda, abych to daval do separe vlakna, ale asi to udelam :-D
Jasně udělej to jako další zařízení s návodem ať to máme pohromadě sem viewforum.php?f=287
nebo co už začal Lion viewtopic.php?t=1075
Pokud nejsem přítomen tak jsem na rybách ;)

kiklhorn
Moderátor
Moderátor
Příspěvky: 739
Registrován: 03. červenec 2021, 18:35
Dal poděkování: 84 poděkování
Dostal poděkování: 175 poděkování

Re: ASSIST - česky hlasem ovládat domácího asistenta

Příspěvek od kiklhorn »

strjan píše: 26. říjen 2023, 14:40 Super shrnuti, dik :-)
Jak se divas na pouziti mikrofonu pro konferencni hovory, treba tohle? https://www.alza.cz/audio-technica-atr4 ... 856922.htm
Mikrofon, jeden, obyčejný, kondenzátorový. Všesměrový - chytí vše, žádné zpracování zvuku nemá.
Navíc Alza asi zkopírovala jeho údaje ze stejně označeného typu jen bez USB - jinak by tam nemohli uvádět impedanci.
Vyzkoušej, nic od toho nečekej, uvidíš, 14 dní na vrácení...

Asi to bude někde mezi těmito dvěma:
Snímek obrazovky 2023-10-26 183404.jpg
Mikrofony zhruba v půlce mezi mnou a televizí.
Nechám hrát hudbu a začnu mluvit. První půlka je mikrofonní pole, druhá realtek vestavěný v monitoru.
Přílohy
mikdrofonyAudacityFormát.zip
(986.67 KiB) Staženo 3 x
Vše co si přinesu domů je buď Shelly, nebo to skončí buď pod ESPhome nebo pod Zigbee2mqtt.
Ajťák co pamatuje BBS a OS/2 Warp a je mu jedno o jaký systém nebo síťařinu běží.
HA OS jako jedna z Proxmox VM na Odroid H3+/64GB https://github.com/tteck/Proxmox

BigSandy
Nováček na fóru
Nováček na fóru
Příspěvky: 2
Registrován: 06. březen 2022, 06:53

Re: ASSIST - česky hlasem ovládat domácího asistenta

Příspěvek od BigSandy »

Hojte chlopi.
Cele jsem to tu pročet a obdivují Vaše nadšení.
Na straně 9 je to čínské heblo na ovládaní hlasem.
Kámoš ho koupil a testovali jsme ho. Měli jsme ho tak půl metru od sebe a pokud bylo ticho, tak fungoval.
Stačilo však pustit slabě televizí, a už se nechytal. Leží někde v supliku.
Jak je to u Vás při testovaní?
Dik.

Uživatelský avatar
Pete30
Moderátor
Moderátor
Příspěvky: 2901
Registrován: 30. září 2020, 20:33
Dal poděkování: 152 poděkování
Dostal poděkování: 319 poděkování

Re: ASSIST - česky hlasem ovládat domácího asistenta

Příspěvek od Pete30 »

Nejdříve jsem o něm uvažoval, potom jsem to vzdal, ale pravděpodobně ho testoval kiklhorn tak třeba vnese trochu světla ohledně této komponenty.
Pokud nejsem přítomen tak jsem na rybách ;)

kiklhorn
Moderátor
Moderátor
Příspěvky: 739
Registrován: 03. červenec 2021, 18:35
Dal poděkování: 84 poděkování
Dostal poděkování: 175 poděkování

Re: ASSIST - česky hlasem ovládat domácího asistenta

Příspěvek od kiklhorn »

Ale to je očekávané chování...

Ještě jednou opakuji - jeden mikrofon, pokud jej nechci nosit připnutý na krku, je pro rozpoznávání hlasu v reálném "hlučném" prostředí naprosto k ničemu.

Co můžu maximálně udělat s jedním mikrofonem když z něj chci dostat pouze hlas? No musí to být ten nejsilnější zvuk. Všechno slabé uříznout.
Je jedno jestli jej nazvou konferenční, vhodný pro hlas apod. Pokud je uvnitř pouze jeden mikrofon je to reálně k ničemu.

Jak udělat to heblo pomocí SW? Kdo umí alespoň udělat nějakou automatizaci v HA tak tohle za pár dní s trochou vyhledávání zvládne.
Znáte ten vtip jak se loví medvědi(audio) s puškou na jeleny(video)?
Nainstalujeme si Python...

Vezmeme stream z mikrofonu, volitelně aplikujeme frekvenční filtr 300 - 3400Hz ať je méně dat ke zpracování a zbavíme se tím zbytečných (pro hlas) frekvencí, vezmeme vzorek o délce cca 1.5s, aplikujeme FFT, vyleze nám obrázek, ten předhodíme naučené tensorflow neuronové síti, z ní nám vypadne který z naučených vzorků to je a s jakou pravděpodobností. Vezmeme další 1.5s "okno" zvuku posunuté oproti začátku prvního třeba o 100ms
a postup opakujeme.
Nejdéle asi bude trvat namluvit dostatek vzorků (i se začleněním běžných domácích ruchů) pro naučení neuronové sítě.

Fakt je to s použitím trochy vyhledávání primitivní naprogramovat, byť technologie za tím primitivní rozhodně není.

A bude to lepší než co může být schopné předvést to "heblo"
Vše co si přinesu domů je buď Shelly, nebo to skončí buď pod ESPhome nebo pod Zigbee2mqtt.
Ajťák co pamatuje BBS a OS/2 Warp a je mu jedno o jaký systém nebo síťařinu běží.
HA OS jako jedna z Proxmox VM na Odroid H3+/64GB https://github.com/tteck/Proxmox

Odpovědět

Zpět na „Hlasem česky“