Blicke mit den Google-Teams hinter die Kulissen.
Die Entwicklung von Kopfhörern ist sehr anspruchsvoll. Hohe Audioqualität, aktive Geräuschunterdrückung und maschinelles Lernen auf immer höherem Niveau – das alles sollte in einem winzigen Gerät stecken. Unsere größte Herausforderung bestand darin, all diese Funktionen ohne Abstriche einzubinden. Dafür haben wir uns erst einmal überlegt, wie die idealen Kopfhörer gebaut wären. Dann haben wir die Algorithmen erstellt und sie in Systeme implementiert. Zum Schluss entstand daraus das finale Produkt. Es war eine Herausforderung, aber die individuelle Anpassung jedes Teils des Systems war der beste Weg, um das Produkt zu optimieren.
Vor allem eine Komponente des Magischen Audio-Radierers war ziemlich anspruchsvoll: die sogenannte „Sound-Separation-Engine“, die den Ton in verschiedene Tonspuren segmentiert, einzeln verarbeitet und zur finalen Tonspur neu zusammenmischt. Wir haben lange daran gebastelt. Einige Modelle unseres Systems arbeiteten zu langsam. Bei anderen wiederum ging die Verarbeitung zu schnell, wodurch wir mehrere Prozessorkerne zum Abstürzen gebracht haben. Es hat einige Zeit gedauert, bis wir da die richtige Balance gefunden haben.
Mir erzählen Leute, wie gut sie unsere Geräte finden. Und ich lese Rezensionen von Leuten, die unsere Produkte oder die der Konkurrenz kritisch betrachten. Ich sehe mir die Entwicklungsmöglichkeiten an und frage mich: Welche Probleme können wir für unsere Kundinnen und Kunden lösen? Was könnten wir für sie entwickeln, das ihren Alltag verbessern würde? Mit diesen Fragen versuche ich zu visualisieren, welche Rolle Technologien heute spielen und welche Möglichkeiten es in Zukunft geben könnte.
Die Arbeit an der Einbindung von Gemini Live in die Pixel Buds Pro 2 hat mir einen Vorgeschmack darauf gegeben, was wir mit der Kombination dieser Art von Technologie mit spezifischer Hardware erreichen können. Google befindet sich in einer sehr vorteilhaften Situation: Wir entwickeln fortschrittliche KI wie Gemini und können sie für unsere eigene Hardware verwenden, die intern entwickelte Chips enthält. Ich glaube, wir sind vielleicht das einzige Unternehmen weltweit, dem all diese Möglichkeiten gleichzeitig zur Verfügung stehen.
„Ich verwende Gemini sehr oft. Dabei frage ich mich häufig: „Ob das jetzt wohl funktioniert?“ Anschließend probiere ich es aus. Am meisten überarbeite ich damit meine geschriebenen Texte. Ich nehme die Vorschläge zwar nicht immer an, profitiere aber von der Kritik und dem Wechsel der Perspektive. Ich gebe Gemini einen Text und frage entweder nach Vorschlägen oder lasse ihn aus Sicht einer bestimmten Zielgruppe lesen. So merke ich, ob ich etwas übersehen oder als selbstverständlich betrachtet habe.”
„Mit am liebsten verwende ich Gemini für empathische Prompts – so kann ich mich gut in die Lage anderer versetzen. Es ist interessant, die Denkweise anderer Personen zu übernehmen und Dinge aus ihrer Perspektive heraus zu betrachten. Beispielsweise habe ich geschrieben: „Du bist ein englischer Pirat im Jahr 1712 und segelst in der Karibik. Worum sorgst du dich am meisten? Schreibe in der zweiten Person in einem Stil, der zu einem Piraten passt.“
„Im Zuge eines Hackathons habe ich ein Wähl‑dein‑eigenes‑Abenteuer-Spiel entwickelt, in dem eine Geschichte generiert und illustriert wurde, die man durchspielen konnte. Das hat sehr viel Spaß gemacht und ich war überrascht, wie gut es funktionierte. Ich habe Gemini- und Imagen3-APIs verwendet, sodass eine ganze Menge Prompts dabei herausgekommen sind. Aber das hat auch gezeigt, was für gute benutzerdefinierte Funktionen sich damit erstellen lassen.
Persönlich freue ich mich sehr auf den Launch von Imagen 3, unserem bisher besten Text‑zu‑Bild-Modell, das unglaublich detaillierte Bilder generiert. Es reagiert hervorragend auf Prompts, indem es genau das tut, was man
ihm sagt. Ich freu mich schon darauf, die Ergebnisse der Nutzerinnen
und Nutzer zu sehen, wenn es veröffentlicht wird.“
Nidhi: Dies sind die ersten Pixel Buds mit aktiver Geräuschunterdrückung (ANC). Damit ANC effektiv funktioniert, müssen die Umgebungsgeräusche verarbeitet werden, bevor sie das Trommelfell erreichen, und mit extrem geringer Latenz neutralisiert werden. Dafür verwenden wir einen speziell entwickelten Audio-Chip mit sechs Kernen. Entscheidend ist auch, wie gut der Ohreinsatz den Gehörgang abdichtet. Auch dies beeinflusst die Geräuschunterdrückung maßgeblich. Unsere Silent-Seal-Technologie kompensiert mögliche Audioverluste und maximiert die Lärmunterdrückung. So bieten wir den Nutzer*innen eine störungsfreie Klangkulisse, damit sie vollkommen in ihre Musik eintauchen und alle anderen Geräusche ausblenden können.
Nidhi: Ich freue mich darauf, im Sommer das Fenster offen zu haben und trotzdem den Verkehrslärm ausblenden zu können.
Laura: Ich freue mich darauf, in lauter Umgebung konzentriert arbeiten zu können. Bei den vielen Ablenkungen im Alltag suche ich nach mehr innerer Ruhe. Beim Abschalten lasse ich mir von Google sagen, wann ich in den Transparenzmodus wechseln soll, um kurze Gespräche führen zu können.
Laura: Einer der Schwerpunkte war das Testen und Feintuning von Details. Wir mussten beispielsweise die Winkel der Ohreinsätze und Kappen optimieren, um die Klangqualität und den Tragekomfort zu verbessern. Alles sollte perfekt sein. Deshalb wurden im Laufe der Entwicklung über 1000 Prototypen hergestellt.
Laura: Viele Menschen wissen gar nicht, dass jedes Ohr so einzigartig ist wie ein Fingerabdruck. Die innere Struktur des linken Ohrs kann anders sein als die des rechten. Da jedes Ohr anders ist, empfehlen wir, die Ohreinsätze in verschiedenen Größen auszuprobieren, bis man den perfekten Sitz gefunden hat. Die Pixel Buds Pro bieten einen Dichtungstest – wir spielen einige Sekunden Musik ab und geben den Nutzer*innen dann eine Empfehlung, welche Ohreinsatzgröße für sie am besten geeignet ist.
Nidhi: Ich freue mich auf eine Zukunft, in der alltägliche Aufgaben schneller und automatisiert erledigt werden, sodass ich mehr Zeit für die Dinge habe, die ich liebe, und für die Menschen, die mir wichtig sind.
Laura: Die Technologie wird mit der Zeit noch hilfreicher, zugänglicher und inklusiver. Ich bin gespannt, wie das bisher benachteiligten Gemeinschaften mehr Lebensqualität und Freude bringen wird.