دو حسگر اصلی وجود دارد: میکروفون و دوربین است که می تواند آرایهای از این حسگرها باشد. بینایی از یکی از حواس پنج گانه است و بیشترین راه تشخیص است و بعد از آن شنیدن. گاهی بینایی بیفایده است و باید حتما صدا شنیده شود. ذخیرهسازی و پردازش تصاویر ویدیوئی گران است. سیستم بینایی معمولا در روش ظاهرسازی حساس به نور است حسگر صدا در سلام و مکالمات مورد استفاده قرار میگیرد.
سیگنال صدا: پردازش و ذخیرهسازی سیگنال صدا سادهتر است. و سیستم صدا از نور قویتر است و می تواند جبران منابع تصویر باشد. تعدادی از الگوریتمهای توسعه و بازیابی بینایی از مکانهای ۳D جزئیات اطلاعات فعالیتها را نمایش می دهند.
۳-۳-سلسله مراتب نمایش
رکوردی از تالار ورودی اتاق به مدت ۱۰ روز گرفته می شود هر رکورد در وضوح ۴۸۰*۶۴۰ و با فرمت mpeg-2 که ۳۰ فریم در ثانیه است و دو کانال صدا هم ذخیره می شود. هر روز ۸ ساعت و در ۱۰ روز ۸۰ ساعت فیلم که در ۴ سطح آن را نمایش میدهیم.که با ۴ نام خوانده میشوند. CE عناصر ادراکی هستند. IE فعالیتهای شخصی GF ترکیبی از
فعالیتهای گروهی و GE ترکیبی از رخدادهای گروهی.
عناصر ادراکی شامل مجموعه ای از موجودیتی از اشیا به همراه خصوصیت آنها است. موجودیتها میتوانند: راه رفتن و ایستادن و یا نشستن فرد بیمار روی ویلچر باشد. خصوصیت می تواند شامل اندازه گیری حرکت و نمایش دیداری از موجودیتها باشد. پنج خصوصیت دیداری شامل: مکان، جهت حرکت، سرعت، رنگ پوست و شکل باشد. که در جدول زیر نشان داده شده است.
مکان را با در نظر گرفتن اینکه در حال حاضر کجاست مشخص می شود مثل اتاق نشیمن و راه رفتن را در چند سکانس بررسی می کند اگر جای شخص تغییر کند یعنی فرد حرکت کرده است. GE معنی سکانسهای تصویر و صدا است مثل مکالمات که در ۳ سگمنت زیر مشخص شده اند.
-
- فرد A و B به یکدیگر نزدیک میشوند.
-
- A وB صحبت می کنند.
-
- فرد A وB با یکدیگر یا جدا از یکدیگر خارج میشوند.
فرضیات ما تنها در ۵ مورد زیر است چون مشاهدات ما در زمان و تعداد افراد با یکدیگر محدود نیستند و ممکن است از دید ما خارج شوند.
-
- نزدیکی فرد A و B
-
- جدایی فرد A وB
-
- توقف A وB
-
- ایستادن و صحبت کردن
-
- راه رفتن با کمک یکدیگر
۳-۴-آشکارسازی فیلم
از الگوریتم کاهش پشت زمینه[۲۷] استفاده میکنیم. فریمهای قابل انطباق از متدهای پشت زمینه را فراهم می کند. نویز را حذف می کند گروهی از پیکسلها را (بیشتر از ۱۵ پیکسل) را میخواند یک مرز برای پیکسلها مشخص میکنیم که اختلاف فریمهای رایج و پشت زمینه است. فریم f شامل فعالیتهای دیداری باشد۱=Vfاگر هر یک از قوانین زیر برقرار باشد و گرنه Vf=0 است.
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
-
- دو شکل گرافیکی با رنگ مشخص (Region)یا بیشتر در یک فریم باشد.
-
- Region وجود داشته باشد که پایین فریم نباشد و عرض و ارتفاع آن نسبت به یکدیگر بیشتر از .۷ باشد.
۳-۵-رخدادهای صوتی
از انطباقهای Clarkson و Pentland استفاده می شود که نرمال سازی قدرت سیگنال صدا است.
۳-۶-خصوصیات شکل و رنگ
رنگ اغلب در تمیز دادن موجودیتها در پردازش مورد استفاده قرار میگیرد.از یک هیستوگرام ۸بیتی برا ی هر کدام از رنگهای RGB برای هر موجودیت استفاده می شود. اطلاعات شکل با قسمت بندی فاصله Manhattan نمایش داده
می شود. در این روش هر منطقه[۲۸] شامل مردم یا وسایل است که به ۹ زیرمنطقه[۲۹]تقسیم می شود.
چگالی هر زیرمنطقه بعد از محاسبه مرز آن مساوی ۱ است که بیشتر از ۵۰% است وگرنه مقدار آن صفر است. در انتها برداری با ابعاد ۱۰ داریم برداری که ۹ بلاک آن خصوصیت است و نسبت طول و عرض شکل در هر ثانیه این خصوصیت نوشته می شود. مکان یابی به صورت (x,y,z) است سرعت، جهت و حرکت در هر ثانیه مشخص می شود. رنگ وشکل از روی اولین فریم هر ثانیه تشخیص داده می شود.
۳-۷-آشکارسازی IE
از روش منحنی مخلوط [۳۰]GMMsاستفاده می شود.
۳-۸-آشکارسازی GF و GE
بعد از آشکارسازی IE ما میتوانیم گرافی بسازیم که شامل هر زوج IE باشد. داده های احتمالی GE در هر گراف
می تواند مقادیر مساوی با یک رامحاسبه کند. خروجی GE نتیجه مرتفع ترین احتمال است.
۳-۹-آشکارسازی فعالیتهای انسان از پشت موانع با بهره گرفتن از پویانمایی سیگنالهای رادار دوپلر
هااو لینگ، استاد دانشگاه تگزاس و شبها رم در تحقق بخشیدن به دید اشعهی X یک گام به جلو حرکت کردند. آنها در حال تکمیل سیستمهای راداری هستند که میتوانند فعالیتهای انسانی را از پشت موانع آشکارسازی نموده و این سیگنالها را به تصاویر مجازی شبیه به بازی ویدیئویی تبدیل نمایند.
به گزارش سرویس علم و فناوری پایگاه اطلاع رسانی صبا و به نقل از ساینس دیلی، لینگ در بارهی این پروژه گفت: “چندین برنامهی تحقیقاتی در مورد تصویربرداری از پشت دیوار در حال انجام میباشد اما آنها روی ساخت حسگرهای سخت افزاری با بسیاری از توانائیهای مشخص تمرکز دارند. این کار گران قیمت است. آنچه ما میخواهیم در این پروژه انجام دهیم این است که اول بفهمیم حرکات انسان چگونه در داده های راداری آشکار می شود. سپس این دانش را برای تولید تصویر یک انسان استفاده کنیم.”
سیستمهای راداری فرکانس رادیویی مبتنی بر دوپلر به ویژه برای دنبال کردن رد انسانهای متحرک مناسب میباشند. آنها درهم ریختگی های پس زمینه را از اشیای ساکن جدا کرده و جزئیات کافی را جهت نمایش حرکات پویای قسمت های مختلف بدن را به شکل “میکرودوپلرها” ارائه می دهند.
لینگ گفت: “یک انسان، پویایی حرکتی بسیار پیچیدهای دارد. هنگام راه رفتن، بازوها و پاها بسیار متفاوت از پیچ و تاب خوردن حرکت می کنند و این حرکات لطیف و ریز به صورت علائم منحصربفرد میکرودوپلر ترجمه میشوند.”
لینگ و رم یک شبیهساز رادار دوپلر مبتنی بر فیزیک و با بهره گرفتن از داده های پویانمایی رایانهای از حرکات انسان ساختند. سپس آنها مشخصات مانع را در نمونه شبیه سازی ترکیب کردند. در نهایت، نتایج را با یک نمونه آزمایشی رادار دوپلر که از پیش توسعه داده شده بود با حرکات زندهی انسان در وضعیتهای دید مستقیم و پشت موانع به لحاظ صحت بررسی کردند. چند تن از دانشجویان فارغ التحصیل پیشین و کنونی شامل یونگووک کیم، کرایگ کریستیانسون، نیک وایتلونیس و یانگ لی نیز در این پروژه مشارکت داشتند.
رم گفت: “علائم میکرودوپلر میتوانند ابزارهای مهمی برای نظارت بر فعالیتهای انسان در طول زمانهای طولانی باشد. شبیهساز رادار به ویژه یک وسیله ی قابل انعطاف و غیر گران است که ما میتوانیم برای بهینه کردن پیکربندیهای حسگر و الگوریتمهای پردازش سیگنال از آن استفاده کنیم که برای تولید یک تصویر مجازی دقیق از انسان در پشت انواع مختلف موانع نیاز میباشد. “
۳-۱۰-آشکارسازی از طریق RFID