🧠 Имплантат с генеративным ИИ позволяет парализованным общаться с помощью цифрового аватара, речь и мимика которого синтезируются из сигналов мозга
Исследователи Калифорнийских университетов в Сан-Франциско и Беркли показали передовой мозговой имплантат, который декодирует мысли в синтезированную речь, позволяя парализованным (например, после инсульта как у героини видео) пациентам общаться с помощью цифрового аватара😯
🔥 Имплантат преобразует сигналы мозга в текст со скоростью почти 80 слов в минуту.
[Интересно, что вместо того, чтобы обучать ИИ распознавать целые слова, исследователи создали систему, которая декодирует слова из более мелких компонентов, называемых фонемами. Это подъединицы речи, которые образуют произнесенные слова так же, как буквы образуют письменные слова. "Hello", например, содержит четыре фонемы: "HH", "AH", "L" и "OW".
Используя этот подход, компьютеру нужно было выучить всего 39 фонем, чтобы расшифровать любое слово на английском языке. Это повысило точность системы и сделало ее в три раза быстрее]
🔥 Далее разные нейронки генерируют реалистичный вокал (голос пациента до травмы) и лицевую анимацию, выводят результат на дисплей в реальном времени.
В дальнейшем разработчики обещают сделать беспроводной интерфейс для чипа, а то с проводами в голове не очень-то удобно 🤖
Это всё невероятно круто! 💫
Твоё Светлое будущее
Исследователи Калифорнийских университетов в Сан-Франциско и Беркли показали передовой мозговой имплантат, который декодирует мысли в синтезированную речь, позволяя парализованным (например, после инсульта как у героини видео) пациентам общаться с помощью цифрового аватара
🔥 Имплантат преобразует сигналы мозга в текст со скоростью почти 80 слов в минуту.
[Интересно, что вместо того, чтобы обучать ИИ распознавать целые слова, исследователи создали систему, которая декодирует слова из более мелких компонентов, называемых фонемами. Это подъединицы речи, которые образуют произнесенные слова так же, как буквы образуют письменные слова. "Hello", например, содержит четыре фонемы: "HH", "AH", "L" и "OW".
Используя этот подход, компьютеру нужно было выучить всего 39 фонем, чтобы расшифровать любое слово на английском языке. Это повысило точность системы и сделало ее в три раза быстрее]
🔥 Далее разные нейронки генерируют реалистичный вокал (голос пациента до травмы) и лицевую анимацию, выводят результат на дисплей в реальном времени.
В дальнейшем разработчики обещают сделать беспроводной интерфейс для чипа, а то с проводами в голове не очень-то удобно 🤖
Это всё невероятно круто! 💫
Твоё Светлое будущее