یک فرد به صورت میانگین ۱۵۰۰۰ کلمه در روز صحبت میکند، و هر روزه تعداد بیشتری از این کلمات صرف صحبت کردن با ماشینها میشود. پذیرش بلندگوهای هوشمند با سرعت زیادی انجام شده است و دستیارهای صوتی همچون الکسا به این روند سرعت بیشتری بخشیدهاند. امروزه ۵۳ میلیون نفر در ایالات متحده صاحب حداقل یکی از این دستگاهها هستند. در ایالات متحده، تعداد دستیارهای صوتی در خانهها نسبت به سال ۲۰۱۸ دوبرابر شده است (به ۲۵ میلیون رسیده است) و تا سال ۲۰۲۳ به ۲۷۵ میلیون افزایش خواهد یافت. بنابر گفته تحقیق جونیپر، این میزان نشانگر ۱۰۰۰% رشد تنها در ۵ سال است.
اسپیکرهای هوشمند تنها دستگاههای تشخیص صدا نیستند. اپلیکیشنهای اسپیکر هوشمند که در تلفنهای همراه هوشمند و تبلتها اجرا میشوند نیز از این قاعده مستثنی نیستند.
برای مثال ممکن است یک فروشنده به فروش یک پلتفرم کنترل صدا بپردازد که قابلیت سازگاری با واژگان یک شرکت یا صنعت، و اجرای آفلاین را داشته باشد. فروشنده دیگر، یک تلویزیون هوشمند مجهز به دستیار مجازی را ارائه دهد. فروشنده سوم نیز به ارائه تعاملات صوتی در محیطهای تولیدی و ساخت بپردازد، که امکان دستیابی کارگران به اطلاعات موردنیازشان را بدون دخالت دست میدهد.
قابلیت کنترل صدای اینترنت اشیا، اتومبیلها را به سوی پذیرش اینترنت اشیا سوق میدهد. هماکنون خودروها با اپلیکیشنهای موبایلی یکپارچه سازی شدهاند تا امکان بیان دستورات صوتی در هنگام رانندگی را فراهم سازند. گارتنر پیشبینی کرده است که پذیرش اینترنت اشیا در این زمینه تا آخر سال به ۲۰% خواهد رسید.
فناوری تشخیص صدا در خانه و در محل کار
با این که فناوری تشخیص صدا باعث سرعت بخشیدن به روند ورود اینترنت اشیا به محیطهای خانگی شده است، اما پذیرش رابطهای صوتی در محیطهای کار پذیرش کندتری را تجربه کرده است. بر اساس گزارش فناوری تشخیص صدا گلوبانت در ۲۰۱۸، شکاف عمیقی میان استفاده شخصی از دستگاههای فرمان صوتی و استفاده تجاری از آنها وجود دارد. با وجود این که ۷۲% از کارمندان ارشد به صورت هفتگی از فناوری تشخیص صدا در زندگی شخصی خود استفاده میکنند، تنها ۳۱% از آنها، در محل کار نیز از این فناوری استفاده میکنند. ۷۳% از شرکتهایی که مورد مطالعه قرار گرفتهاند، فناوری تشخیص صدا را برای شرکت خود ارزشمند میدانند اما هیچ قدمی در جهت به کارگیری آن در فرآیندهای کاری خود برنداشتهاند.
بر اساس گزارش پیندراپ که در سال ۲۰۱۸ انجام شد، ۸۵% از شرکتهای مورد مطالعه به کار گیری فناوری تشخیص صدا برای تعامل با مشتری را در برنامه کار خود قرار دادهاند. از میان این مدیران، ۸۸% باور دارند که فناوری تشخیص صدا میتواند برتری رقابتی برایشان ایجاد کند، و ۵۷% بر این عقیدهاند که این فناوری شرکت آنها را کارآمدتر خواهد کرد.
علاوه بر این، استقرار اولیه فناوری تشخیص صدا در یک شرکت، به جای تمرکز بر سختافزار اختصاصی اینترنت اشیا، بر پشتیبانی مشتریان مبتنی بر ابر تمرکز دارد که از طریق گوشیهای هوشمند و لپتاپها قابل دسترسی است. صنایع دیگر همچون حمل و نقل و تولید، برای فراهم کردن پهنای باند لازم برای فناوری تشخیص صدا نیازمند پردازش لبهای هستند. در نتیجه پذیرش فناوری تشخیص صدا کندتر خواهد بود، چرا که استقرار این فناوری در این محیطها نیازمند سرمایهگذاری بیشتر در سرورهای لبهای برای افزایش پهنای باند پردازش تا حد قابل قبول است.
استفاده از اسپیکر هوشمند
به جای ساخت اپلیکیشنهای تشخیص صدا یا پرداخت هزینه برای سیستمهای گران قیمت، شرکتها میتوانند با استفاده از امکانات موجود هزینههای مربوط به فناوری تشخیص صدا را کاهش دهند؛ تنها کافی است تا هزینهای به آمازون پرداخت کنند تا این مهارت جدید را به الکسا بیافزاید.
در سال ۲۰۱۶ که آمازون برای اولین بار الکسا را معرفی کرد، دارای ۱۳۰ مهارت بود؛ در سپتامبر ۲۰۱۹ مهارتهای این سرویس به ۱۰۰۰۰۰ افزایش یافت. آمازون با دریافت هزینه مهارتهای سفارشی را نیز به الکسا میافزاید، و همچنین کیت مهارتهای الکسا را نیز ارائه میدهد که مجموعهای از رابطهای برنامه نویسی اپلیکیشن، ابزارها و کدهای نمونه است که توسعه دهنده شخص ثالث میتواند با استفاده از آنها مهارت خاص خود را بسازد. این مهارتهای جدید را میتوان برای هر فرد یا شرکتی که از قابلیت فرمان صوتی الکسا استفاده میکند قابل دسترسی ساخت.
این استراتژی باعث میشود که پذیرش اینترنت اشیای تشخیص صدا در شرکتها با سرعت بیشتر و هزینه کمتر انجام شود، و نیاز به منابع لبهای را نیز از میان میبرد. این ترفند ممکن است کارآیی آن را کاهش دهد، اما فناوری را وارد شرکت کرده و آن را با فرآیندهای تجاری یکپارچه میسازد.
یک مثال عالی از نحوه ایجاد فناوری تشخیص صدا توسط کیت مهارتهای الکسا، کیدز ام دی (KidsMD) است که یک اپلیکیشن برای بیمارستان کودکان بوستون میباشد. والدین میتوانند سوالات خود در مورد بیماری یا جراحت کودک را پرسیده و به صورت لحظهای اطلاعاتی در مورد فرآیند درمان یا تجویز دارو دریافت نمایند.
این بیمارستان یک اپلیکیشن الکسا نیز ساخته است که متخصص گوارش از آن در اتاق عمل برای تشخیص صدای دوربین آندوسکوپی استفاده میکند. در ICU پرستاران از اپلیکیشنی استفاده میکنند که اطلاعات لازم برای دریافت میزان مناسب خون را فراهم میکند که ۱۵ تا ۳۰ دقیقه در زمان هر بیمار صرفه جویی مینماید؛ یک نسخه دیگر از کیدز ام دی نیز وجود دارد که اطلاعاتی در مورد عملیات و عیبیابی برای کارکنان بیمارستان فراهم میکند.
اربیتا (Orbita) که مجموعهای از دستیاران سلامتی مجازی تولید میکند، این تواناییها را تعمیم داده و پلتفرم خود را در اختیار بسیاری از دستگاهها قرار داده است – گوشیهای هوشمند، تبلتها، اسپیکرهای هوشمند – که به مصرف کنندگان امکان یافتن موقعیت مکانی درمانگاهها، سفارش داروها، تعیین قرار ملاقات، دریافت نتیجه آزمایشات و تنظیم هشدار برای مراقبت از خود را میدهد. سرویس اربیتا اسیست IoT آن نیز یک دستیار مجازی در کنار تخت است که برقراری ارتباط را آسانتر ساخته، زمان انتظار را کاهش میدهد، مدیریت گروه کلینیکی را بهینه کرده و تجربه بیمار را بهبود میبخشد.
انواع جدید اپلیکیشنهای تشخیص صدا
تمامی این رویکردها برای یکپارچه سازی فناوری تشخیص صدا با فرآیندهای مصرفی و حرفهای، پذیرش اینترنت اشیا در کل را سرعت میبخشد؛ اما فناوری تشخیص صدا باعث توسعه فرآیندهای جدید نیز میشود.
یکی از کاربردهای جالب فناوری تشخیص صدا در دستگاههای مخصوص نابینایان نهفته شده است که به آنها امکان تعامل با جهان به شیوهای جدید را میدهد. دیگر کاربرد آن در فناوریهای پوشیدنی بدون صفحه نمایش است (فناوریهای پوشیدنی نقش پر رنگی در پیشرفت آگاهی عمومی از اینترنت اشیا داشتهاند)، که نیازمند یک اپلیکیشن موبایلی برای نمایش دادهها به کاربر است و با استفاده از فناوری تشخیص صدا به سرعت عمل خواهد کرد.
شاید یکی از تحولسازترین کاربردهای آن در توانایی ترجمه باشد. فناوری تشخیص صدا در اینترنت اشیا به همراه هوش مصنوعی که ترجمه را فراهم میآورد، بسیاری از موانع در کسب و کار را حذف کرده و کیفیت زندگی شخصی را نیز افزایش خواهد داد. ترجمه لحظهای و دستگاههای اینترنت اشیا که میتوانند آن را پوشش دهند، در محل کار میتواند کنفرانسهای راه دور چند زبانه را کارآمدتر سازد. در خانه نیز کودکانی که به پذیرش خانوادههایی با زبان گفتاری دیگر درآمدهاند، میتوانند با استفاده از یک گوشی هوشمند و اپلیکیشن ترجمه (همچون برنامه آیترنسلیت اپل) و هندزفری، با اعضای خانواده جدید خود تعامل داشته باشند.
اینترنت اشیا به سرعت در حال انتشار است و فناری تشخیص صدا، سرعت انتشار آن را بیشتر میکند. کودکان امروز، به خاطر نخواهند داشت که زمانی خودروها، خانهها و اشیای اطراف آنها حرف نمیزدند.