"Home Assistant's year of Voice". Wird das "Siri 2.0"?

  • Zitat

    Das klingt deutlich natürlicher als alle anderen Sprachasssistenten

    Amazon Polly mal probiert? Da gibt es ein großes Freikontingent und die Auswahl der Stimmen und die Aussprache-Steuerungparameter sind sehr umfangreich.

    Einzig die Integration ist leider "Legacy" und bedarf configuration.yaml

    Z1013, iMac G4/800 17", iMac Retina 5K 27", MacBook Air 13″ (M3), Mac mini (M4 pro), iPhone 16 Pro Max, 256GB, iPad Pro 11" (M4), Apple TV 4k und HD, HomePod minis, Apple Watch SE 44 mm

  • Nein, es ist nicht die Stimme. Das ist bei Elevenlabs super (kostet aber dafür auch ordentlich Geld). Wenn ich die Stimme auf z.B. einen Echo schicke, ist das super. Sogar am iPhone klingt das gut. Es ist der kleine Lautsprecher, der die „Illusion“ zerstört, leider. :(

  • Hallo Holger ,
    für TTS/STT verlege ich den Thread-Link mal hier her.

    Zitat

    kostet aber dafür auch ordentlich Geld

    Wieviel Consumption hast Du denn so im Monat?

    Für TTS nutze ich aktuell Polly, aber eher nur in Automationen, die was ansagen.

    Z1013, iMac G4/800 17", iMac Retina 5K 27", MacBook Air 13″ (M3), Mac mini (M4 pro), iPhone 16 Pro Max, 256GB, iPad Pro 11" (M4), Apple TV 4k und HD, HomePod minis, Apple Watch SE 44 mm

  • Für TTS habe ich in den Anfängen von meinen Home Assistant Ausflügen einmal das kostenlose Reverso-TTS mit der Stimme „Klaus-German“ benutzt, weil das sehr natürlich geklungen hat.

    Aber das habe ich jetzt sicher auch schon sechs Jahre nicht mehr verfolgt, da ich keinerlei Anwendung dafür habe.

    Rechnerhistorie

    Z80: ZX81
    68k: Atari Mega ST, PAK-030, FRAK, Performa 475, Quadra 660AV
    ARM: Messagepad 120, Messagepad 2100
    PowerPC: Pios Magna, PowerMac G3, PowerBook G3 Lombard, PowerMac 8600, iBook G3, PowerBook G4, Cube G4
    Intel: Mac mini 2012, MacBook Pro 2012, Mac Pro 2013 10-Core
    ARM: Mac mini M1

  • Reverso-TTS

    Das Repo is schon archived. Und mal ehrlich, wenn man gute Sprache unbedingt will, dann geht wohl eher nichts an payed services vorbei. Mal unabhängig von der Fragestellung was gebe ich "in die Cloud"...

    Z1013, iMac G4/800 17", iMac Retina 5K 27", MacBook Air 13″ (M3), Mac mini (M4 pro), iPhone 16 Pro Max, 256GB, iPad Pro 11" (M4), Apple TV 4k und HD, HomePod minis, Apple Watch SE 44 mm

  • Puhh.... Consumption? Schwierig. Ich hatte mit dem rabattierten "Creator" Plan angefangen, weil ich anfangs sehr viel damit rumgespielt habe. Da meine ursprüngliche Idee das mit eigener Hardware zu nutzen an der Qualität der Hardware gescheitert ist, ist die Nutzung aber ganz deutlich gesunken. Ich habe jetzt mal ein Downgrade auf "Starter" gemacht. Vermutlich werden auch da die "Credits" locker ausreichen. Ist wie gesagt schwierig: "Bastelphase" ist nicht repräsentativ für die Alltagsnutzung denke ich.

    PS: Aber die Qualität ist mit den "V3" Stimmen tatsächlich noch mal beeindruckender.

  • So gefühlt 20 Converations
    Der Inhalt kann nicht angezeigt werden, da du keine Berechtigung hast, diesen Inhalt zu sehen. Aber melde dich gerne bei uns an und werde Teil der Community!

    Z1013, iMac G4/800 17", iMac Retina 5K 27", MacBook Air 13″ (M3), Mac mini (M4 pro), iPhone 16 Pro Max, 256GB, iPad Pro 11" (M4), Apple TV 4k und HD, HomePod minis, Apple Watch SE 44 mm

  • Das ist aber der "Free" Plan, oder?


    wobei.... ich komme halt nicht mal pro Woche auf 20 Konversationen. Das würde bei mir sogar noch reichen.

    Einmal editiert, zuletzt von Holger (10. Februar 2026 um 16:04) aus folgendem Grund: Ein Beitrag von Holger mit diesem Beitrag zusammengefügt.

  • Das ist aber der "Free" Plan, oder?

    ja, ist es "0$/für immer Für Einzelpersonen, die das fortschrittlichste KI-Audio ausprobieren möchten"

    "Starter für 5 $/Monat für Hobbyisten, die Projekte mit KI-Audio erstellen" find ich auch OK. Ich sponser auch Git-Projekt-Developer auf dem Niveau.

    Amazon Polly für TTS hat mehr freies Kontingent. Meine Polly Kosten sind quasi nicht sichtbar:
    Der Inhalt kann nicht angezeigt werden, da du keine Berechtigung hast, diesen Inhalt zu sehen. Aber melde dich gerne bei uns an und werde Teil der Community!

    Z1013, iMac G4/800 17", iMac Retina 5K 27", MacBook Air 13″ (M3), Mac mini (M4 pro), iPhone 16 Pro Max, 256GB, iPad Pro 11" (M4), Apple TV 4k und HD, HomePod minis, Apple Watch SE 44 mm

  • Falls hier noch wer anders mitliest: Dies ist die eher nicht so übersichtliche Übersicht der Pläne bei ElevenLabs: https://elevenlabs.io/app/subscription


    ja, okay.... aber am Ende sind wir ja auf Umwegen in diesem Thread gelandet wegen des Themas "Qualität". Ich habe Polly tatsächlich bisher nicht probiert. Aber reizt mich schon, das mal zu tun...

    Einmal editiert, zuletzt von Holger (10. Februar 2026 um 16:16) aus folgendem Grund: Ein Beitrag von Holger mit diesem Beitrag zusammengefügt.

  • Holger sprechen bei Dir die Elements-Stimmen Maßeinheiten richtig aus? Wenn ja, welch Stimme?

    Bei bspw. „Regen heute 3mm“ gibt es für mm nur ein genuscheltes „mczhpf“


    Bzw.: https://www.heise.de/news/Echovo-br…02-11.link.link

    Vielleicht ein Verfahren für HA Voice…?

    Z1013, iMac G4/800 17", iMac Retina 5K 27", MacBook Air 13″ (M3), Mac mini (M4 pro), iPhone 16 Pro Max, 256GB, iPad Pro 11" (M4), Apple TV 4k und HD, HomePod minis, Apple Watch SE 44 mm

  • Holger Der sieht ja niedlich aus - Würde ich glatt mal versuchen, den in mein HA-Setup einzubauen - aber ist da ein "Leiseprecher" drin?

    Z1013, iMac G4/800 17", iMac Retina 5K 27", MacBook Air 13″ (M3), Mac mini (M4 pro), iPhone 16 Pro Max, 256GB, iPad Pro 11" (M4), Apple TV 4k und HD, HomePod minis, Apple Watch SE 44 mm

  • Der von dir Verlinkte scheint mir tatsächlich keinen eigenen Lautsprecher zu haben. Was aber nicht schlimm sein muss, dafür hat er einen Audio-Ausgang. Die Teile, die ich habe, mit eigenen Lautsprechern klingen wirklich nicht gut. Die sind einfach zu klein. Das „Blecherne“ nervt tatsächlich. Dann lieber einen „echten“ Lautsprecher mit Audio-Eingang dranhängen.

    Der Grund, warum die alle bei mir in der Schublade liegen, ist allerdings die schlechte Qualität der Mikrofone. Ich habe da noch Hoffnung, dass sich da Softwareseitig was tut. Aber so, wie es beim letzten Mal war, als ich es ausprobiert habe? Nee! Alexa kannst du aus dem Nebenraum zu nuscheln, was auf die Einkaufsliste zu setzen. Diese Teile muss du direkt davor stehend „anbrüllen“. Und das mehrfach. Macht keinen Spass, leider.

    Aber wie gesagt: Vielleicht tut sich da noch was. Oder es hat sich schon was getan. Ich habe es erstmal beiseite gelegt.

  • Sowas kann Siri aktuell noch gar nicht!

    Der Inhalt kann nicht angezeigt werden, da du keine Berechtigung hast, diesen Inhalt zu sehen. Aber melde dich gerne bei uns an und werde Teil der Community!

    Z1013, iMac G4/800 17", iMac Retina 5K 27", MacBook Air 13″ (M3), Mac mini (M4 pro), iPhone 16 Pro Max, 256GB, iPad Pro 11" (M4), Apple TV 4k und HD, HomePod minis, Apple Watch SE 44 mm

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!