Повечето хора свързват Закона за американците с увреждания с физически, инфраструктурни промени, които трябва да бъдат направени в сгради или други места, но тъй като дефиницията за увреждане се разширява, хората осъзнават, че „достъпно“ се отнася и за неща като уебсайтове и разпознаване на глас.
В този случай технологичният гигант Google полага усилия да подобри своя софтуер за разпознаване на глас с Project Euphonia. Проект Euphonia е инициатива за запис на гласови проби от доброволци и анализ на тях, така че хората с ALS, неврологични разстройства и други затруднения в говора да могат да използват своите интелигентни устройства с лекотата на „типичен“ индивид.
Защо се явих доброволно
Парализирана лява гласна струна и асиметричен език, дължащ се на мозъчен тумор, доведоха до моята реч Дизартрия. Неясната ми реч и слабият глас затрудняват приятелите и семейството да ме разберат или чуят-особено в претъпкано място. Това ме направи основен кандидат за проект „Евфония“, затова се явих доброволно веднага щом прочетох за него. Записвайки мостри на елементарен уебсайт, повторих 4500 фрази от „Как да стигна до Маунтин Вю, Калифорния?“ До „Пускане на песни от Cardi B“.
Освен че отговарях на критериите на Project Euphonia, аз бях доброволец, защото за първи път се запознах с първокласната програма за разпознаване на глас Dragon Naturally Speaking през 1997 г.-и тя се провали грандиозно. През годините опитах аналогични програми в лабораторията за помощни технологии в детската болница в Бостън, както и актуализирани версии на Дракон, и въпреки че този софтуер постигна голям напредък, той все още се бори да определи гласа ми.
Това е проблематично по две причини: аз съм писател с липса на фини двигателни умения, затова пиша с една ръка или бавно с две, ако съм уморен. С три самостоятелно публикувани книги със стихове, мемоари и колекция от непубликувани свързани истории с моето име, изтръпвам и си мисля колко повече бих могъл да произведа, ако писането не беше толкова физически трудна задача.
Другата причина, поради която разпознаването на глас под номинала създава бариера за мен, е поради разпространението на продукти с активиран глас в домовете и на телефоните. Само с помощта на моята история, ако имах достъп до компютри и интелигентни устройства по начина, по който са предназначени да бъдат използвани, това би ми дало повече свободно време, би ми позволило да изпълнявам изцяло задачи и потенциално би променило начина ми на живот.
Проект Евфония: Как работи?
И така, как работи Евфония? След като изтеглих прототипно приложение с персонализиран модел за разпознаване на реч в телефона си, поставих телефона до лаптопа си и му продиктувах; докато правех това, гледах всичко, което казах, да се появява в моя Google Doc на моя лаптоп. Правех това в продължение на няколко месеца, записвайки фрази от роман, който пишех, и коригирах всички неточности за Google, използвайки приложението.
След още няколко месеца без запис на фрази, завърших първия проект на роман - 20 000 думи - с помощта на приложението. Това не означава, че е безупречно; за всеки час, който пиша, трябва да се връщам и да прекарвам един час, правейки малки корекции. Но нямам нищо против, защото Еуфония е в бета етап и вместо бавно да пробивам 100 думи на ден, генерирам 500 думи на ден.
След това има фактът, че Евфония не е създадена за текстообработка - по -скоро за декларативни команди - и моят стил на писане е това, което наричат „пантер“ (прелетя до седалката на панталоните ви), така че имам много паузи защото не знам как ще завърши едно изречение - знаете, като Майкъл Скот. Когато знам какво искам да кажа, обаче, като в текстове, имейли или давайки инструкции на моя асистент, това е най -точното разпознаване на реч, което някога съм използвал.
Когато институции като Google дават глас на хората с увреждания при проектирането на архитектурата на бъдещето, оставяйки ги да останат себе си, вместо да се опитват да ги превърнат в нещо „нормално“, това ми дава надежда, че в ерата на AI хуманизмът ще надделее.
Ако искате да посетите уебсайта на Project Euphonia или имате нарушение на речта и искате да внесете гласова извадка, можете да отидете на тази връзка: https://sites.research.google/euphonia/about/