طموحة بشكل لا يصدق من 5000 نموذج 3S في الأسبوع وبداية "الجحيم الإنتاج" ، وكان المحللون حذرين. لكن ايلون مسكأصر على أنه يستطيع سحبها ، مشيرا إلى فرط التشغيل الآلي - خط التجميع الروبوتية - كسلاحه السري لزيادة سرعة التصنيع وخفض التكاليف. سريع إلى الأمام سنة ونصف وتسليم تسلا91،000 مركبة في الربع الرابع من عام 2018. لكن الارتفاع لم يأت من دون مشاكل هائلة والابتعاد عن رؤية Musk's الأصلية لخط تجميع آلي للغاية.
ماذا حدث؟
وردا على سؤال عن السبب في أن الدفع نحو الأتمتة لم ينفجر ، فإن إيلون الإجابة تدور حول قضية رئيسية واحدة : الرؤية الآلية ، أو البرمجيات التي تتحكم في ما يمكن لروبوتات خط التجميع "رؤيته" ثم تقوم على رؤية الكمبيوتر هذه. لسوء الحظ ، لم يستطع روبوتات خط التجميع التعامل مع الاتجاهات غير المتوقعة للأجسام مثل المكسرات والمسامير الملولبة ، أو المناورة المعقدة بين إطار السيارة. كل هذه القضية من شأنه أن يتسبب في توقف خط التجميع. في النهاية ، كان من الأسهل بكثير استبدال البشر بالروبوتات في العديد من حالات التجميع.
اليوم ، رؤية الكمبيوتر (مصطلح شامل للرؤية الآلية) موجودة في كل مكان وتمثل الحدود التالية لتقنيات الذكاء الاصطناعي والتطبيقات الرائدة عبر مجموعة متنوعة من الصناعات. التقدم الذي أحرز الآن من قبل الباحثين والشركات في الفضاء مثيرة للإعجاب وتمثل القطع المفقودة اللازمة لجعل رؤية ألون موسك لخط تجميع السيارات الآلي حقيقة واقعة. في جوهرها ، سوف تعطي هذه التطورات أجهزة الكمبيوتر والروبوتات القدرة على التعامل بشكل موثوق مع مجموعة كبيرة من حالات الزوايا غير المتوقعة - تلك المكسرات والبراغي الشاذة - التي تحدث في العالم الحقيقي.
لحظة فاصلة في رؤية الكمبيوتر
شهدت رؤية الكمبيوتر لحظة فاصلة في عام 2012 مع تطبيق الشبكات العصبية التحويلية. منذ ذلك الحين ، لقد التقطت البخار بالفعل. قبل عام 2012 ، كانت رؤية الكمبيوتر تعتمد بشكل كبير على الحلول اليدوية - فالخوارزميات قد حددت مجموعات القواعد بشكل يدوي ويمكن أن تصف رياضيا سمات الصورة بشكل فعال نسبيا. وقد تم اختيارهم يدويًا ثم دمجهم باحث في رؤية الكمبيوتر من أجل تحديد كائن معين في صورة ما ، مثل دراجة هوائية أو واجهة محل أو وجه.
لقد أدى ارتفاع التعلم الآلي والتطورات في الشبكات العصبية الاصطناعية إلى تغيير كل ذلك ، مما سمح لنا بتطوير خوارزميات باستخدام كميات هائلة من بيانات التدريب التي يمكن أن تقوم تلقائيًا بفك شفرة ميزات الصور وتعلمها. كان التأثير الصافي لذلك مضاعفًا: (1) أصبحت الحلول أكثر قوة (على سبيل المثال ، يمكن تحديد الوجه كوجه ، حتى لو تم توجيهه بشكل مختلف قليلاً ، أو في الظل) ، و (2) إيجاد حلول جيدة أصبح يعتمد على كميات كبيرة من بيانات التدريب عالية الجودة (نماذج تتعلم ميزات تستند إلى بيانات التدريب ، لذلك فمن الأهمية بمكان أن تكون بيانات التدريب دقيقة وكافية من حيث الكمية وتمثل التنوع الكامل للحالات التي قد ترى الخوارزمية لاحقًا).
الآن في المختبر: GAN ، والتعلم غير المرخّص والبيانات الاصطناعية
بعد ذلك ، تتيح الأساليب الجديدة مثل GANs (الشبكات التنافسية المتقاربة) ، والتعلم غير الخاضع للرقابة والحقيقة الأرضية الاصطناعية إمكانية تقليل كل من كمية بيانات التدريب المطلوبة لتطوير نماذج رؤية الكمبيوتر عالية الجودة ، بالإضافة إلى الوقت والجهد المطلوبين لجمع البيانات. من خلال هذه الطرق ، يمكن للشبكات في الواقع أن تهيئ عملية التعلم الخاصة بها وتتعرف على حالات الزوايا والقيم المتطرفة بدقة أعلى ، أسرع بكثير. يستطيع البشر حينئذ تقييم حالات الزاوية لتحسين الحلول والوصول إلى نموذج عالي الجودة بسرعة أكبر بكثير.
تعمل هذه الأساليب الجديدة على توسيع نطاق رؤية الكمبيوتر بسرعة من حيث التطبيقات والقوة والموثوقية. ليس فقط أنهم يحملون الوعد بحل تحديات السيد مسك للتصنيع ، بل سيوسعون الحدود إلى حد كبير في التطبيقات الهامة التي لا تعد ولا تحصى ، وبعضها مبين أدناه:
- أتمتة التصنيع: ستصبح لدى الروبوتات على نحو متزايد القدرة على التعامل مع الأشياء في اتجاهات عشوائية ، مثل مقعد السيارة الذي يبعد عن مركزها بـ 20 درجة أو برغي يبلغ طوله بوصة واحدة عن اليسار. وعلاوة على ذلك ، ستتمكن الروبوتات من التعرف على أشياء ناعمة ومرنة وشفافة بشكل موثوق (فكِّر مثلاً في كيس بلاستيكي من الجوارب التي طلبتها في أمازون الأسبوع الماضي). مقدمو برامج الروبوت الجدد مثل Berkshire Gray هم في طليعة هذا.
- كشف الوجه: في السابق ، لم يكن اكتشاف الوجه قويًا في حالات الزوايا مثل الزوايا الجانبية أو التظليل الجزئي أو الانسداد أو وجوه الأطفال. الآن ، يجد الباحثون أن رؤية الكمبيوتر يمكن أن تعمل على تحديد الاضطرابات الوراثية النادرة من صورة الوجه ، مع دقة 90٪. يتم وضع بعض التطبيقات في أيدي المستهلكين ، وهذا ممكن فقط لأن الخوارزميات أصبحت أكثر قوة لظروف الإضاءة المتنوعة والحالات الأخرى التي تنشأ نتيجة لسيطرة أقل على التقاط الصور.
- التصوير الطبي: يسمح التقدم الآن بأتمتة تقييم التصوير بالرنين المغناطيسي ، وكشف سرطان الجلد ، وعدد من حالات الاستخدام الهامة الأخرى .
- مساعدة السائق والأتمتة: كانت أنظمة القيادة الذاتية تفشل عندما كانت ضبابية ، لأنها لم تكن قادرة على التفريق بين الضباب الثقيل والصخور. الآن ، بدأ التعلم غير الخاضع للرقابة والقدرة على إنشاء البيانات الاصطناعية (بقيادة أمثال نفيديا ) لاستخدامها لتدريب النظام على حالات الزوايا التي لا يمكن حتى لملايين من أميال القيادة المسجلة الكشف عنها.
- الزراعة: أصبحت شركات مثل بلو ريفر تكنولوجي(التي حصل عليها جون ديري) قادرة الآن على التمييز بين الأعشاب والمحاصيل ، ورش مبيدات الأعشاب بشكل انتقائي تلقائياً ، مما أتاح تقليصاً هائلاً في كمية المواد الكيميائية السامة المستخدمة في الزراعة التجارية.
- معلومات العقارات والممتلكات: إن استخدام رؤية الكمبيوتر على قمة الصور الجغرافية المكانية يمكن أن يسمح للشركات بالتحديد تلقائياً عندما تسبب الفيضانات أو حرائق الغابات أو رياح الأعاصير خطرًا على خصائص معينة - مما يسمح لأصحاب المنازل بالتحرك بشكل أسرع قبل وقوع الكارثة.
عند النظر إلى هذه التطورات ، سرعان ما يتضح شيء واحد: لم يكن إيلون مسك مخطئا. انها مجرد رؤيته (الروبوتية وغيرها) كانت سنة أو سنتين بعيدا عن الواقع. تقترب الذكاء الاصطناعي والرؤية الحاسوبية والروبوتات من نقطة حرجة من الدقة والموثوقية والفعالية. بالنسبة لـ Tesla ، فإن هذا يعني أن المنحدر التالي إلى "جحيم الإنتاج" (المحتمل للنموذج Y) سيشاهد خط تجميع مختلف تمامًا في مصنعي Fremont و Shanghai - أحدهما سيحقق نجاحًا أكبر في تنفيذ الروبوتات المقترنة برؤية الكمبيوتر.
ليست هناك تعليقات:
إرسال تعليق