چگونه یک کامپیوتر می داند کجا هستید؟

تصور کنید رانندگی یک ماشین، با استفاده از یک صفحه نمایش سرپوش بر روی شیشه جلو اتومبیل برای حرکت از طریق یک شهر ناآشنا. این واقعیت تقویت شده است (AR)؛ اطلاعات استفاده شده است که نه تنها به شما در مسیر مسیر هدایت می کند، بلکه همچنین شما را به اطلاعات برجسته در اطراف خود، مانند دوچرخه سواران و پیاده ها، هشدار می دهد. قرار دادن صحیح محتوای مجازی نه تنها حیاتی است، بلکه شاید مهمترین مسئله زندگی و مرگ است.

اطلاعات نمی تواند مطالب دیگر را مبهم کند و باید به اندازه کافی به اندازه کافی نمایش داده شود تا شما بتوانید آن را درک کنید، اما خیلی طولانی تر از آن نیست. سیستم های کامپیوتری باید این تعیین را در زمان واقعی انجام دهند بدون این که هیچگونه اطلاعات را مانع و یا مزاحمتی ایجاد کنند. ما قطعا نمی خواهیم یک هشدار در مورد یک دوچرخه سوار در مورد عبور از جلو ماشین را به مظنون خود را دوچرخه سوار!

به عنوان یک محقق در AR، من زمان زیادی را صرف تلاش برای کشف نحوه دریافت اطلاعات درست بر روی صفحه نمایش کاربر، فقط در جای مناسب، در لحظه مناسب است. من یاد گرفته ام که نشان دادن اطلاعات بیش از حد می تواند کاربر را اشتباه بگیرد، اما به اندازه کافی نشان نمی دهد که برنامه را بی فایده کند. ما باید نقطه شیرین در میان را پیدا کنیم.

به نظر می رسد یک عنصر مهم از این است که کاربران کجا هستند. فقط پس از آن می توانیم اطلاعاتی را که می خواهیم در یک مکان ارائه دهیم که در آن بتوانیم آن را پردازش کنیم. تحقیق ما شامل اندازه گیری جایی است که کاربر در صحنه واقعی به دنبال است، به عنوان راهی برای کمک به تصمیم گیری در مورد جای دادن محتوای مجازی. با AR آرزوی نفوذ به بسیاری از مناطق زندگی ما - از رانندگی به کار به تفریح - ما باید قبل از اینکه بتوانیم بر روی AR تأکید کنیم برای حمایت از اقدامات جدی یا بحرانی، این مشکل را حل کنیم.

تعیین محل کپی اطلاعات

این منطقی است که اطلاعاتی که در آن کاربر به دنبال آن هستید، ظاهر شود. هنگام مرور، یک کاربر می تواند به یک ساختمان، خیابان یا دیگر شیء واقعی برای نشان دادن اطلاعات مرتبط مجازی نگاه کند؛ سیستم می داند برای مخفی کردن تمام نمایش های دیگر برای جلوگیری از لرزش صحنه قابل رویت.


گرافیک اشتراک درونی


اما چگونه می دانیم چه کسی به دنبال آن است؟ معلوم می شود که تفاوت های ظاهری بینایی انسان به ما اجازه می دهد که در چشمان فرد بررسی کنیم محاسبه جایی که آنها به دنبال. با جفت کردن این داده ها با دوربین هایی که میدان دید فردی را نشان می دهند، می توانیم تعیین کنیم که چه کسی فرد را ببیند و چه چیزی به دنبال آن است.

سیستم های ردیابی چشم اول در 1900s ظاهر شدند. در اصل آنها اغلب برای مطالعه الگوهای خواندن استفاده می شدند؛ برخی ممکن است برای خواننده بسیار مهیج باشند. اخیرا، ردیابی چشم در زمان واقعی ظهور کرده و تبدیل به مقرون به صرفه تر، آسان تر به کار و کوچکتر است.

ردیاب چشم می تواند به صفحه نمایش و یا یکپارچه به عینک های قابل پوشیدگی و یا روی صفحه نمایش نصب شده است. چشم ها با استفاده از ترکیبی از ردیابی می شوند دوربین ها، پیش بینی ها و الگوریتم های بینایی کامپیوتر برای محاسبه موقعیت چشم و نقطه نظر بر روی مانیتور.

هنگام بررسی داده های ردیابی چشم، معمولا به دو روش نگاه می کنیم. اولین بار نامیده می شود تثبیت، و برای توصیف زمانی که ما نگاه ما را متوقف می کنیم، اغلب در یک مکان جالب در یک صحنه مورد استفاده قرار می گیرد، زیرا توجه ما را جلب کرده است. دوم است ساکادیکی از حرکات چشم سریع استفاده شده برای قرار دادن چشم. دوره های کوتاه تثبیت به دنبال حرکات سریع، به نام ساکاده ها. اساسا، چشم ما به سرعت از محل به مکان جابجا می شود و قطعه ای از اطلاعات مربوط به قسمت های یک صحنه را می گیرد. مغز ما پس از آن اطلاعات را از این fixations با هم برای ایجاد تصویر بصری در ذهن ما قرار داده است.

{youtube}tdFIvRMvFQI{/youtube}

ترکیب ردیابی چشم با AR

اغلب محتوای AR بر روی شیء یا مکان واقع در دنیای مجازی قرار دارد. برای مثال، یک برچسب مجازی حاوی نام خیابان باید در آن خیابان نمایش داده شود. در حالت ایدهآل، ما دوست داریم که برچسبهای AR نزدیک به شیء واقعی مرتبط با آن ظاهر شود. اما ما همچنین باید مراقب باشیم که اجازه ندهیم چندین نشانگر AR با هم همپوشانی کنند و تبدیل به قابل خواندن نشوند. رویکردهای متعددی برای مدیریت قرار دادن برچسب وجود دارد. ما در حال بررسی یکی از گزینه ها هستیم: محاسبه جایی که فرد در صحنه واقعی به دنبال آن می رود و برچسب های AR را فقط در آن نقطه نمایش می دهد.

بگو، برای مثال، یک کاربر در تعامل با یک برنامه تلفن همراه است که به او کمک می کند تا برای غلات کم کالری در فروشگاه مواد غذایی خریداری کند. در برنامه AR، هر غلات دارای اطلاعات کالری مرتبط با آن است. به جای اینکه هر جعبه غلات فیزیکی را برداشت و محتوای غذایی را خواند، کاربر میتواند دستگاه تلفن همراه خود را نگه دارد و آن را در یک جعبه غلات ویژه برای نشان دادن اطلاعات مربوطه نمایش دهد.

اما فکر می کنم در مورد چگونگی شلوغ شدن یک فنجان قهوه در فروشگاه با بسته های مختلف است. بدون هیچ گونه راهکار برای مدیریت نمایش برچسبهای AR، برچسبهای اطلاعات کالری برای همه جعبههای غلات نمایش داده میشوند. معلوم نیست که محتوای کالری غلات مورد علاقه او چیست.

با ردیابی چشمانش می توانیم مشخص کنیم که کدام جعبه غلات فردی کاربر به دنبال آن است. سپس ما اطلاعات کالری برای این غلات خاص را نمایش می دهیم. هنگامی که او نگاه خود را به جعبه دیگری تغییر می دهد، ما ارقام را برای یکی دیگر از او می بینیم. صفحه نمایش او بی نظیر است، اطلاعاتی که می خواهد به آسانی در دسترس باشد و زمانی که او نیاز به اطلاعات بیشتری دارد، می توانیم آن را نمایش دهیم.

این نوع توسعه باعث می شود زمان هیجان انگیزی برای تحقیق AR باشد. توانایی ما برای ادغام صحنه های واقعی در گرافیک کامپیوتری روی صفحه نمایش تلفن همراه، بهبود می یابد. این امر چشم انداز ایجاد برنامه های کاربردی خیره کننده جدید را گسترش می دهد که توانایی ما برای ارتباط برقرار کردن با آن، یادگیری از طریق جهان و اطراف ما را سرگرم می کند.

درباره نویسنده

ان مک نامارا، دانشیار تجسم، تگزاس A & M دانشگاه

این مقاله در اصل در تاریخ منتشر شد گفتگو. دفعات بازدید: مقاله.

کتاب های مرتبط

at