• boredsquirrel@slrpnk.net
    link
    fedilink
    arrow-up
    6
    ·
    2 months ago

    Die tollen “neural engines” auf den Geräten lösen auch das Problem der unwirtschaftlichkeit solcher Massenüberwachung.

    Audio mitschneiden, mit whisper transkribieren, mit KI in ein Werbeprofil umwandeln, das einmal die Woche irgendwo hochladen.

    • GenosseFlosse@feddit.org
      link
      fedilink
      arrow-up
      1
      ·
      edit-2
      2 months ago

      Audio to text software gab es schon in den 1990ern und wurde z.b. bei der bestellannahme von Katalog Kaufhäusern eingesetzt. Die Handys von heute sind viel Leistungsfähiger als die PCs vor 25 Jahren, dazu braucht man heute keine KI oder spezielle Hardware mehr.

        • GenosseFlosse@feddit.org
          link
          fedilink
          arrow-up
          2
          ·
          2 months ago

          Ich hatte damals in einer firma gearbeitet die solche software (um die eigentliche spracherkennung, die als software von IBM kam) fuer solche callcenter entwickelt hat. Also sprackerkennung, ISDN-karten und dann eine software die das alles zusammenfuegt und sich noch per GUI programmieren laesst.

          Gut war die spracherkennung damals auch nicht da sie eben noch sehr neu war, z.b. gab es probleme sie so abzustimmen das sie sprache von maennern und frauen gleichzeitig verstanden hat, da die tonlage relativ weit auseinander lag. Bei starkem regionalem dialekt hat sie auch nichtmehr viel verstanden. Inzwischen wird sich aber viel getan haben.