به گزارش رسانه تحلیلی خبری آناژورنال گوگل روز پنجشنبه اعلام کرد که مجموعهای از ویژگیهای جدید هوش مصنوعی و دسترسیپذیری را برای سیستمعامل اندروید و مرورگر کروم منتشر میکند.
مهمترین این ویژگیها بهروزرسانی TalkBack، صفحهخوان اندروید، است که حالا به کاربران اجازه میدهد درباره تصاویر و محتوای صفحه خود با دستیار هوش مصنوعی Gemini سوال بپرسند.
جدیدترین اخبار تکنولوژی را در آناژورنال بخوانید.
سال گذشته گوگل این قابلیت را برای TalkBack معرفی کرده بود تا افراد نابینا یا کمبینا بتوانند از توضیحات هوشمندانه AI برای تصاویر بهره ببرند، حتی وقتی متنی جایگزین (Alt Text) موجود نبود.
حالا کاربران میتوانند سوال بپرسند و پاسخهایی درباره تصاویر یا کل صفحه گوشی خود دریافت کنند.
برای مثال، اگر دوستی تصویری از گیتار جدیدش ارسال کند، میتوانید درباره برند و رنگ آن سوال کنید. یا وقتی در حال خرید آنلاین هستید، میتوانید درباره جنس کالا یا تخفیف موجود سوال بپرسید.
گوگل همچنین Expressive Captions (زیرنویسهای زنده اندروید) را بهروزرسانی کرده است.
این قابلیت به کمک هوش مصنوعی، نه تنها کلمات بلکه نحوه گفتن آنها را نیز ثبت میکند.
برای مثال میتوانید بفهمید وقتی یک گزارشگر ورزشی میگوید “amaaazing shot” یا فردی میگوید “nooooo”، تفاوت را تشخیص دهید. همچنین علائم صوتی مانند سوت زدن یا صاف کردن گلو نیز به زیرنویس اضافه شدهاند.
این بهروزرسانیها فعلاً به زبان انگلیسی و در کشورهای آمریکا، بریتانیا، کانادا و استرالیا برای دستگاههای مجهز به اندروید ۱۵ و بالاتر ارائه میشود.
در کروم نیز گوگل امکان دسترسی بهتر به فایلهای PDF را فراهم کرده است.
قبلاً امکان استفاده از صفحهخوان روی PDFهای اسکنشده وجود نداشت، اما حالا با فناوری OCR، کروم به طور خودکار این فایلها را شناسایی کرده و امکان جستجو، کپی و برجستهسازی متن را فراهم میکند.
علاوه بر این، قابلیت Page Zoom در کروم برای اندروید به کاربران اجازه میدهد بدون تغییر در قالب صفحه، اندازه متن را بزرگ کنند و تنظیمات بزرگنمایی را روی همه صفحات یا فقط صفحات خاصی اعمال کنند.
سوالات متداول:
۱. ویژگی جدید TalkBack چگونه به افراد کمبینا کمک میکند؟
TalkBack اکنون با کمک هوش مصنوعی Gemini توضیحات دقیقتری درباره تصاویر و محتوای صفحه ارائه میدهد و کاربران میتوانند درباره جزئیات تصاویر سوال بپرسند.
۲. Expressive Captions چیست و چه تغییری کرده است؟
Expressive Captions زیرنویسهای زندهای است که حالا علاوه بر متن، نحوه بیان کلمات (مثلاً کشیدهگویی یا صداهای محیطی) را هم نشان میدهد.
۳. فناوری OCR چه تاثیری در کروم دارد؟
با فناوری OCR، کروم میتواند متن داخل PDFهای اسکنشده را شناسایی کند و امکان کپی، جستجو و خواندن توسط صفحهخوان را فراهم کند.
۴. قابلیت Page Zoom چه امکاناتی دارد؟
کاربران میتوانند اندازه متن را بدون تغییر چیدمان صفحه بزرگ کنند و این تنظیمات را به صورت کلی یا برای صفحات خاص اعمال نمایند.
ارسال پاسخ
نمایش دیدگاه ها