ESP32-S3-BOX-3

hardware podporující Assist Probouzecí slovo pro hlasové ovládání Home Assistant
janchan
Aktivní autor
Aktivní autor
Příspěvky: 66
Registrován: 11. květen 2022, 18:54
Dal poděkování: 61 poděkování
Dostal poděkování: 8 poděkování

Re: ESP32-S3-BOX-3

Příspěvek od janchan »

OK, předání zvuku na NestMini v pořádku, bez zádrhelu.

Uživatelský avatar
Pete30
Moderátor
Moderátor
Příspěvky: 2901
Registrován: 30. září 2020, 20:33
Dal poděkování: 152 poděkování
Dostal poděkování: 319 poděkování

Re: ESP32-S3-BOX-3

Příspěvek od Pete30 »

Zatím jen jednoduchý dotaz, fungují dobře hlasové příkazy i na větší vzdálenost a i když například hraje TV ?
Pokud nejsem přítomen tak jsem na rybách ;)

kiklhorn
Moderátor
Moderátor
Příspěvky: 739
Registrován: 03. červenec 2021, 18:35
Dal poděkování: 84 poděkování
Dostal poděkování: 175 poděkování

Re: ESP32-S3-BOX-3

Příspěvek od kiklhorn »

Televizi to zvládá, jen poslouchá delší dobu než bez ní. Vzdálenost jsem netestoval.

//edit:

Podmínky tohoto testu - od TV (mluvené slovo) asi 2m, natočen bokem. Ode mne asi 1m, předkem.
Vše co si přinesu domů je buď Shelly, nebo to skončí buď pod ESPhome nebo pod Zigbee2mqtt.
Ajťák co pamatuje BBS a OS/2 Warp a je mu jedno o jaký systém nebo síťařinu běží.
HA OS jako jedna z Proxmox VM na Odroid H3+/64GB https://github.com/tteck/Proxmox

janchan
Aktivní autor
Aktivní autor
Příspěvky: 66
Registrován: 11. květen 2022, 18:54
Dal poděkování: 61 poděkování
Dostal poděkování: 8 poděkování

Re: ESP32-S3-BOX-3

Příspěvek od janchan »

Zkoušel jsem na vzdálenost cca 4 metry v pokoji, a v pohodě rozumí.
Dohromady s TV je to ale horší. Probudím slovem Box a on už naslouchá vše okolo. Takže pokud se v TV mluví, tak můj hlasový příkaz je za slovy z TV a Box samozřejmě tomu příkazu nerozumí. A i když jsem dal hlasový povel co nejdříve po probuzení, tak opět pokud v TV někdo mluví, tak box ho po mém příkazu dál poslouchá, takže opět tomu všemu dohromady nerozumí.
Hudba mu nevadí.

\\Edit: Přemístil jsem box co nejvíce do boku od TV, a je to výrazně lepší. Chybovost se tím snížila, ale pořád tam nějaká malá je.
Naposledy upravil(a) janchan dne 12. listopad 2023, 18:10, celkem upraveno 1 x.

Uživatelský avatar
Pete30
Moderátor
Moderátor
Příspěvky: 2901
Registrován: 30. září 2020, 20:33
Dal poděkování: 152 poděkování
Dostal poděkování: 319 poděkování

Re: ESP32-S3-BOX-3

Příspěvek od Pete30 »

Tak to vypadá docela super.
Pokud nejsem přítomen tak jsem na rybách ;)

strjan
Pokročilý
Pokročilý
Příspěvky: 170
Registrován: 13. červenec 2023, 16:04
Dal poděkování: 12 poděkování
Dostal poděkování: 3 poděkování

Re: ESP32-S3-BOX-3

Příspěvek od strjan »

A nedala by se TV na chvíli umlčet když detekuje slovo? To skoro bude obecnější problém, mluvené slovo z jakéhokoliv zdroje asi nemá jak odlišit.

Uživatelský avatar
Pete30
Moderátor
Moderátor
Příspěvky: 2901
Registrován: 30. září 2020, 20:33
Dal poděkování: 152 poděkování
Dostal poděkování: 319 poděkování

Re: ESP32-S3-BOX-3

Příspěvek od Pete30 »

To mě taky napadlo, ať se jedná o TV nebo rádio, pokud jsou integrované do HA a je možnost ovládat mute/unmute tak potom zavolat službu z box3 na HA a ty zdroje zvuku na nějaký časový limit on/off.
Mám teď takto udělán media_player když volám nebo mi někdo volá na telefon tak se mi stopne a po ukončení hovoru se opět spustí.
Pokud nejsem přítomen tak jsem na rybách ;)

kiklhorn
Moderátor
Moderátor
Příspěvky: 739
Registrován: 03. červenec 2021, 18:35
Dal poděkování: 84 poděkování
Dostal poděkování: 175 poděkování

Re: ESP32-S3-BOX-3

Příspěvek od kiklhorn »

strjan píše: 13. listopad 2023, 16:20 A nedala by se TV na chvíli umlčet když detekuje slovo? To skoro bude obecnější problém, mluvené slovo z jakéhokoliv zdroje asi nemá jak odlišit.
Myslel jsem že o mikrofonech jsem toho už napsal dost...
Zkouším vymyslet nějakou analogii. Celý proces si zpomalíme. A zjednodušíme. A pochopí to teď už snad opravdu každý kdo si najde pět minut a tužku a papír.

Znalosti asi tak první stupeň základní školy.
Výpočet rovnoramenného trojúhelníku. Ramena a základna. OK? A mravenci chodící po přímce stejnou rychlostí. Černí a červení.
Černí představují vzorek jednoho hlasu, červení jiného. Pořád je to hlas, mravenci jsou si hodně podobní, ale ne stejní.

Od jednoho zdroje zvuku, z jednoho bodu - reproduktor televize - vychází ve stejnou chvíli dva stejní černí mravenci a míří přímo k našim dvěma mikrofonům.
Jdou stejně rychle,každý po své přímce přímo ke svému mikrofonu, známou rychlostí. Jeden po nějakém čase dorazí k mikrofonu. Druhý to má k druhému mikrofonu o kousek (třeba 5cm) dál, tak dorazí o něco později.

A my mluvíme z jiného směru. Dva červení mravenci vyrážejí na pochod k mikrofonům. První dorazí k mikrofonu za nějaký čas, druhý má o 1cm delší cestu tak dorazí později.

Víme že mikrofony jsou od sebe vzdáleny 5cm (základna trojúhelníku). Víme že mravenci chodí po přímce a stejně rychle (a je jedno jestli si pro výpočet zvolíme cca reálných 330m/s nebo 1cm/s). Pro pochopení principu to není důležité.
Kdo dokáže spočítat ze kterého bodu (vzhledem k mikrofonům) vyšli černí a červení mravenci?
V tomto konkrétním příkladu pro černé vyjde bod jen jeden, pro červené dva.
Spoiler
Tady výsledek není...
Pokud máte nakresleno tak už víte proč je možné rozlišit zvuky přicházející ze "dvou" různých bodů i v jakém případe body rozlišit nejdou.

A pokud by byly mikrofony tři a po třech mravencích - více výpočtů, méně možných vrcholů
a pokud budou mikrofony čtyři a po čtyřech mravencích, nebo sedm mikrofonů?
A není už čtyři zbytečně moc? Tak se přeneseme z 2D plochy do reálného 3D prostoru a jdeme počítat dále...
Vše co si přinesu domů je buď Shelly, nebo to skončí buď pod ESPhome nebo pod Zigbee2mqtt.
Ajťák co pamatuje BBS a OS/2 Warp a je mu jedno o jaký systém nebo síťařinu běží.
HA OS jako jedna z Proxmox VM na Odroid H3+/64GB https://github.com/tteck/Proxmox

strjan
Pokročilý
Pokročilý
Příspěvky: 170
Registrován: 13. červenec 2023, 16:04
Dal poděkování: 12 poděkování
Dostal poděkování: 3 poděkování

Re: ESP32-S3-BOX-3

Příspěvek od strjan »

Triangluace zdroje zvuku je jasna. Ted jsem zapomnel kdo (mozna jeden z Braagu?), ale vymyslel to za 1. svetovy kdyz pri delostrelecke palbe nadskakoval na latryne. Pro zajimavost, jako detekror pak pouzili oporovy drat a merili zmenu vodisti vlivem zmeny teploty, ktera byla zpusobena tlakovou vlnou z vystrelu...

Ale mas skutecne nakalibrovane, kde je televize umistena vzhledem k satelitu abys toto odliseni mohl provadet? Nebo predpokladas, ze je TV vzdy vzhledem k satelitu pod tak ostrym uhlem, ze to jednoznacne rozlisis?

kiklhorn
Moderátor
Moderátor
Příspěvky: 739
Registrován: 03. červenec 2021, 18:35
Dal poděkování: 84 poděkování
Dostal poděkování: 175 poděkování

Re: ESP32-S3-BOX-3

Příspěvek od kiklhorn »

Ona nemusí být pod ostrým úhlem - jen mám dva zdroje zvuku (spíše tři, nebo šest, osm - podle reproduktorů) a dokážu rozlišit že přicházejí z různých míst. Tím se dá spočítat zvuková čočka, fokus a ostatní ignorovat. jasně - algoritmy nejsou dokonalé, ani mikrofony nemají nekonečnou dynamiku, vhodnou polohou mikrofonů se tomu dá pomoci. Se dvěma mikrofony si nemůžu dovolit to co se čtyřmi - tedy že nechám mikrofony v půlce cesty mezi mnou a televizí, ke mně čelem, k televizi zády - nerozliší co přichází z předu a co ze zadu. Pro mikrofony je to jeden dvojvrchol trojúhelníku. <|>
Vše co si přinesu domů je buď Shelly, nebo to skončí buď pod ESPhome nebo pod Zigbee2mqtt.
Ajťák co pamatuje BBS a OS/2 Warp a je mu jedno o jaký systém nebo síťařinu běží.
HA OS jako jedna z Proxmox VM na Odroid H3+/64GB https://github.com/tteck/Proxmox

Odpovědět

Zpět na „HW pro Probouzecí slovo“