HOME ASSISTANT je otevřená, multiplatformní, aplikace pro domácí automatizace a chytrou domácnost kladoucí důraz na lokální ovládání a bezpečnost tvořená celosvětovou komunitou nadšenců a kutilů skvělá pro provoz na Raspberry Pi nebo jiném místním serveru
kiklhorn píše: ↑24. říjen 2023, 21:10
Frameworky, chyby, mikrofony (proč to s jedním mikrofonem nikdy dobře fungovat nebude), ESP, Raspberry(linux obecně), zpracování audia - zkusím do toho vnést alespoň trochu světla.
Pete30 píše: ↑22. říjen 2023, 23:30
Na čem ti to běží a jaké jsou poznatky ?
Rozchodil jsi to na tom Rpi + mic ?
Jo, "rozchodil". Nekde vysse jsem to popisoval. Zatim jsem nenabyl dojmu, ze by to byla tak raketova veda, abych to daval do separe vlakna, ale asi to udelam
Mikrofon, jeden, obyčejný, kondenzátorový. Všesměrový - chytí vše, žádné zpracování zvuku nemá.
Navíc Alza asi zkopírovala jeho údaje ze stejně označeného typu jen bez USB - jinak by tam nemohli uvádět impedanci.
Vyzkoušej, nic od toho nečekej, uvidíš, 14 dní na vrácení...
Asi to bude někde mezi těmito dvěma:
Mikrofony zhruba v půlce mezi mnou a televizí.
Nechám hrát hudbu a začnu mluvit. První půlka je mikrofonní pole, druhá realtek vestavěný v monitoru.
Vše co si přinesu domů je buď Shelly, nebo to skončí buď pod ESPhome nebo pod Zigbee2mqtt.
Ajťák co pamatuje BBS a OS/2 Warp a je mu jedno o jaký systém nebo síťařinu běží.
HA OS jako jedna z Proxmox VM na Odroid H3+/64GB https://github.com/tteck/Proxmox
Hojte chlopi.
Cele jsem to tu pročet a obdivují Vaše nadšení.
Na straně 9 je to čínské heblo na ovládaní hlasem.
Kámoš ho koupil a testovali jsme ho. Měli jsme ho tak půl metru od sebe a pokud bylo ticho, tak fungoval.
Stačilo však pustit slabě televizí, a už se nechytal. Leží někde v supliku.
Jak je to u Vás při testovaní?
Dik.
Ještě jednou opakuji - jeden mikrofon, pokud jej nechci nosit připnutý na krku, je pro rozpoznávání hlasu v reálném "hlučném" prostředí naprosto k ničemu.
Co můžu maximálně udělat s jedním mikrofonem když z něj chci dostat pouze hlas? No musí to být ten nejsilnější zvuk. Všechno slabé uříznout.
Je jedno jestli jej nazvou konferenční, vhodný pro hlas apod. Pokud je uvnitř pouze jeden mikrofon je to reálně k ničemu.
Jak udělat to heblo pomocí SW? Kdo umí alespoň udělat nějakou automatizaci v HA tak tohle za pár dní s trochou vyhledávání zvládne.
Znáte ten vtip jak se loví medvědi(audio) s puškou na jeleny(video)?
Nainstalujeme si Python...
Vezmeme stream z mikrofonu, volitelně aplikujeme frekvenční filtr 300 - 3400Hz ať je méně dat ke zpracování a zbavíme se tím zbytečných (pro hlas) frekvencí, vezmeme vzorek o délce cca 1.5s, aplikujeme FFT, vyleze nám obrázek, ten předhodíme naučené tensorflow neuronové síti, z ní nám vypadne který z naučených vzorků to je a s jakou pravděpodobností. Vezmeme další 1.5s "okno" zvuku posunuté oproti začátku prvního třeba o 100ms
a postup opakujeme.
Nejdéle asi bude trvat namluvit dostatek vzorků (i se začleněním běžných domácích ruchů) pro naučení neuronové sítě.
Fakt je to s použitím trochy vyhledávání primitivní naprogramovat, byť technologie za tím primitivní rozhodně není.
A bude to lepší než co může být schopné předvést to "heblo"
Vše co si přinesu domů je buď Shelly, nebo to skončí buď pod ESPhome nebo pod Zigbee2mqtt.
Ajťák co pamatuje BBS a OS/2 Warp a je mu jedno o jaký systém nebo síťařinu běží.
HA OS jako jedna z Proxmox VM na Odroid H3+/64GB https://github.com/tteck/Proxmox