من خلال التركيز على مشاعر البشر ، وتماثل الجسم ووضع القدم ، يقوم باحثو جامعة ميشيغان بتعليم السيارات ذاتية القيادة للتعرف على حركات المشاة والتنبؤ بها بدقة أكبر من التقنيات الحالية.
تسمح البيانات التي تجمعها المركبات من خلال الكاميرات ، و LiDAR و GPS للباحثين بالتقاط مقتطفات الفيديو للبشر في الحركة ثم إعادة إنشائها في محاكاة الكمبيوتر ثلاثية الأبعاد. مع ذلك ، أنشأوا " شبكة عصبية متكررة مستوحاةبيوميكانيكيا " التي تذيع الحركات البشرية.
تسمح البيانات التي تجمعها المركبات من خلال الكاميرات ، و LiDAR و GPS للباحثين بالتقاط مقتطفات الفيديو للبشر في الحركة ثم إعادة إنشائها في محاكاة الكمبيوتر ثلاثية الأبعاد. مع ذلك ، أنشأوا " شبكة عصبية متكررة مستوحاةبيوميكانيكيا " التي تذيع الحركات البشرية.
مع ذلك ، يمكنهم التنبؤ بالمواقع ومواقع المستقبل لواحد أو أكثر من المشاة تصل إلى حوالي 50 ياردة من السيارة. هذا حول نطاق تقاطع المدينة.
وقال رام فاسوديفان ، الأستاذ المساعد في الهندسة الميكانيكية ، "عمل سابق في هذا المجال لم ينظر عادة إلا في الصور الثابتة. لم يكن مهتما حقا بكيفية تحرك الناس في ثلاثة أبعاد." "ولكن إذا كانت هذه السيارات ستعمل وتتفاعل في العالم الحقيقي ، فإننا نحتاج إلى التأكد من أن توقعاتنا حول مكان سير المشاة لا تتطابق مع المكان الذي ستذهب إليه السيارة بعد ذلك".
إن تزويد السيارات بالقدرة التنبؤية اللازمة يتطلب من الشبكة الغوص في تفاصيل الحركة البشرية: سرعة المشية البشرية (دورية) ، وتناظر المرآة للأطراف ، والطريقة التي يؤثر بها وضع القدم على الثبات أثناء المشي.
لقد تعامل الكثير من التعلم الآلي المستخدم في جلب التكنولوجيا المستقلة إلى مستواها الحالي مع صور ثنائية الأبعاد - صور ثابتة. في النهاية ، سيظهر جهاز كمبيوتر يظهر عدة ملايين من صور علامةالتوقف للتعرف على علامات التوقف في العالم الحقيقي وفي الوقت الفعلي.
ولكن من خلال استخدام مقاطع الفيديو التي يتم تشغيلها لعدة ثوانٍ ، يمكن لنظام UM دراسة النصف الأول من المقتطف لإجراء تنبؤاته ، ثم التحقق من الدقة في النصف الثاني.
"الآن ، نحن نقوم بتدريب النظام على التعرف على الحركة والتنبؤ ليس فقط بشيء واحد - سواء كان علامة توقف أم لا - ولكن حيث سيكون جسد المشاة في الخطوة التالية والتالية التالية" ، قال ماثيو جونسون-روبرسون ، أستاذ مشارك في قسم الهندسة المعمارية والهندسة البحرية في جامعة أم.
ولتفسير نوع الاستقراءات التي يمكن للشبكة العصبية القيام بها ، يصف فاسودافان المشاهد الشائعة.
وقال فاسوديفان: "إذا كان أحد المشاة يلعب بهاتفه ، فأنت تعرف أنه مشغول". "إن موقفهم وأين ينظرون إليه هو إخباركم كثيرًا عن مستوى انتباههم. كما أنه يخبركم كثيرًا عما يمكنهم فعله بعد ذلك".
وقد أظهرت النتائج أن هذا النظام الجديد يتحسن عند قدرة مركبة بدون سائق على التعرف على ما هو أكثر احتمالا أن يحدث بعد ذلك.
وقال جونسون-روبرسون "كان خطأ الترجمة المتوسطة في توقعاتنا حوالي 10 سم بعد ثانية واحدة وأقل من 80 سم بعد ست ثوان. جميع طرق المقارنة الأخرى كانت تصل إلى سبعة أمتار." "نحن أفضل في معرفة أين سيكون الشخص."
لكبح عدد الخيارات للتنبؤ بالحركة التالية ، طبق الباحثون القيود المادية لجسم الإنسان - عدم قدرتنا على الطيران أو أسرع سرعة ممكنة على الأقدام.
لإنشاء مجموعة البيانات المستخدمة لتدريب الشبكة العصبية التابعة لـ UM ، قام الباحثون بإيقاف سيارة ذات خصائص مستقلة من المستوى 4 في العديد من تقاطعات آن آربور. ومع وجود كاميرات السيارة واليدار أمام التقاطع ، يمكن أن تسجل المركبة عدة أيام من البيانات في كل مرة.
عزز الباحثون ذلك العالم الحقيقي ، "في البرية" البيانات من مجموعات البيانات التقليدية التي تم التقاطها في المختبر. والنتيجة هي نظام من شأنه أن يرفع مستوى ما تستطيع المركبات التي تعمل بدون سائق.
"نحن منفتحون على التطبيقات المتنوعة وفرص التعاون متعددة التخصصات المثيرة ، ونأمل في خلق والمساهمة في بيئة معيشية أكثر أمانا وصحة ، وأكثر كفاءة" ، وقال مهندس البحوث UM Xiaoxiao دو.
ليست هناك تعليقات:
إرسال تعليق