อาหาร (Diet)

DIY Calorie Counter แม่นยำกว่าสมาร์ทโฟน

แม้แต่สำหรับ Google ความท้าทายก็ยังน่ากลัว บางอย่างยากแต่ตรงไปตรงมา: สำหรับแอปพลิเคชันหุ่นยนต์ส่วนใหญ่ การรวบรวมชุดข้อมูลขนาดใหญ่ที่ขับเคลื่อนความก้าวหน้าในด้านอื่นๆ ของ AI นั้นเป็นเรื่องยาก แต่ปัญหาบางอย่างก็ลึกซึ้งกว่า และเกี่ยวข้องกับปริศนาที่มีมายาวนานใน AI ปัญหาเช่น คุณจะเรียนรู้งานใหม่โดยไม่ลืมงานเก่าได้อย่างไร และคุณจะสร้าง AI ที่สามารถใช้ทักษะที่เรียนรู้สำหรับงานใหม่กับงานที่เชี่ยวชาญมาก่อนได้อย่างไร ความสำเร็จจะหมายถึงการเปิด AI ให้กับแอปพลิเคชันประเภทใหม่ หลายๆ สิ่งที่เราต้องการให้ AI ทำอย่างแรงกล้าที่สุด เช่น ขับรถและรถบรรทุก ทำงานในบ้านพักคนชรา ทำความสะอาดหลังภัยพิบัติ ทำงานบ้านขั้นพื้นฐาน สร้างบ้าน หว่าน บำรุงเลี้ยง และเก็บเกี่ยวพืชผล—จะสำเร็จได้ด้วยหุ่นยนต์เท่านั้น มีความซับซ้อนและหลากหลายกว่าที่เรามีตอนนี้มาก นอกเหนือจากการเปิดตลาดที่อาจใหญ่โตแล้ว งานนี้ยังมีประเด็นโดยตรงที่มีความสำคัญอย่างยิ่ง ไม่ใช่แค่สำหรับวิทยาการหุ่นยนต์เท่านั้น แต่สำหรับการวิจัย AI ทั้งหมด และสำหรับความเข้าใจในสติปัญญาของเราเองด้วย มาเริ่มกันที่ปัญหาเดิมๆ กันก่อน โครงข่ายประสาทเทียมนั้นดีพอๆ กับคุณภาพและปริมาณของข้อมูลที่ใช้ในการฝึกเท่านั้น ความพร้อมใช้งานของชุดข้อมูลจำนวนมหาศาลเป็นกุญแจสู่ความสำเร็จล่าสุดใน AI: ซอฟต์แวร์การรู้จำภาพได้รับการฝึกอบรมเกี่ยวกับรูปภาพที่มีป้ายกำกับหลายล้านภาพ AlphaGo ซึ่งเอาชนะปรมาจารย์ในเกมกระดานโบราณของ Go ได้รับการฝึกฝนเกี่ยวกับชุดข้อมูลเกมของมนุษย์หลายแสนเกม และเกมนับล้านที่เล่นด้วยตัวเองในการจำลอง อย่างไรก็ตาม ในการฝึกหุ่นยนต์นั้น ชุดข้อมูลขนาดใหญ่ดังกล่าวจะไม่สามารถใช้งานได้ “นี่เป็นปัญหา” Hadsell ตั้งข้อสังเกต คุณสามารถจำลองเกม Go นับพันเกมได้ในเวลาไม่กี่นาที รันควบคู่ไปกับ CPU หลายร้อยตัว แต่ถ้าหุ่นยนต์ใช้เวลา 3 วินาทีในการหยิบถ้วย คุณทำได้เพียง 20 ครั้งต่อนาทีต่อหุ่นยนต์ ยิ่งไปกว่านั้น หากระบบการจดจำภาพของคุณทำให้ภาพล้านภาพแรกผิดพลาด อาจไม่มีความสำคัญมากนัก แต่ถ้าหุ่นยนต์เดินสองเท้าของคุณตกลงมามากกว่า 1,000 ครั้งแรกที่มันพยายามจะเดิน แสดงว่าคุณจะมีหุ่นยนต์ที่เว้าแหว่ง หากไม่แย่ไปกว่านั้น ปัญหาของข้อมูลในโลกแห่งความเป็นจริง—อย่างน้อยก็ในตอนนี้—ผ่านไม่ได้ แต่นั่นไม่ได้หยุด DeepMind ไม่ให้รวบรวมทุกอย่างที่ทำได้ โดยมีหุ่นยนต์ส่งเสียงหึ่งๆ ในห้องแล็บอย่างต่อเนื่อง นักวิจัยด้านวิทยาการหุ่นยนต์กำลังพยายามหลีกเลี่ยงข้อมูลที่ขาดแคลนนี้ด้วยเทคนิคที่เรียกว่าซิมสู่ความเป็นจริง ห้องปฏิบัติการ OpenAI ในซานฟรานซิสโกเพิ่งใช้ประโยชน์จากกลยุทธ์นี้ในการฝึกมือหุ่นยนต์เพื่อแก้ลูกบาศก์รูบิค นักวิจัยได้สร้างสภาพแวดล้อมเสมือนจริงที่มีลูกบาศก์และแบบจำลองเสมือนของมือหุ่นยนต์ และฝึก AI ที่จะควบคุมมือในการจำลอง จากนั้นพวกเขาก็ติดตั้ง AI ไว้ในมือของหุ่นยนต์จริง และมอบลูกบาศก์รูบิกของจริงให้กับมัน โปรแกรมจำลองสถานการณ์จริงช่วยให้หุ่นยนต์จริงสามารถไขปริศนาทางกายภาพได้ แม้จะประสบความสำเร็จเช่นนี้ แต่เทคนิคนี้ก็มีข้อจำกัดที่สำคัญ Hadsell กล่าว โดยสังเกตว่านักวิจัย AI และ Rodney Brooks นักวิจัยด้านหุ่นยนต์ “ชอบที่จะบอกว่าการจำลองนั้น ‘ถึงวาระที่จะประสบความสำเร็จ’ ” ปัญหาคือการจำลองนั้นสมบูรณ์แบบเกินไป ลบออกจากความซับซ้อนของโลกแห่งความเป็นจริงมากเกินไป “ลองนึกภาพหุ่นยนต์สองตัวในการจำลอง พยายามประกอบโทรศัพท์มือถือเข้าด้วยกัน” Hadsell กล่าว หากคุณอนุญาตให้พวกเขาลองนับล้านครั้ง ในที่สุดพวกเขาก็อาจค้นพบว่าด้วยการโยนชิ้นส่วนทั้งหมดขึ้นไปในอากาศด้วยแรงที่พอเหมาะพอดี ด้วยจำนวนการหมุนที่เหมาะสม ทำให้พวกเขาสามารถสร้างมือถือได้ในไม่กี่วินาที : ชิ้นส่วนต่างๆ ตกลงมาตรงตำแหน่งที่หุ่นยนต์ต้องการ เพื่อสร้างโทรศัพท์ นั่นอาจทำงานได้ในสภาพแวดล้อมที่คาดเดาได้อย่างสมบูรณ์ของการจำลอง แต่ไม่สามารถทำงานในความเป็นจริงที่ซับซ้อนและยุ่งเหยิงได้ สำหรับตอนนี้ นักวิจัยต้องจัดการกับแบบจำลองที่ไม่สมบูรณ์เหล่านี้ Hadsell อธิบาย “คุณสามารถเพิ่มเสียงรบกวนและความสุ่มตัวอย่างปลอมได้ แต่ไม่มีการจำลองแบบร่วมสมัยที่ดีพอที่จะสร้างความเป็นจริงขึ้นมาใหม่ได้อย่างแท้จริงแม้แต่ชิ้นเล็ก ๆ ของความเป็นจริง” การลืมอย่างหายนะ: เมื่อ AI เรียนรู้งานใหม่ มีแนวโน้มที่โชคร้ายที่จะลืมงานเก่าทั้งหมด มีปัญหาลึกซึ้งกว่านั้น สิ่งที่ Hadsell สนใจมากที่สุดคือการลืมอย่างหายนะ: เมื่อ AI เรียนรู้งานใหม่ มีแนวโน้มที่โชคร้ายที่จะลืมงานเก่าทั้งหมด ปัญหาไม่ได้อยู่ที่การจัดเก็บข้อมูล มันเป็นสิ่งที่มีอยู่ในวิธีที่ AI สมัยใหม่ส่วนใหญ่เรียนรู้ การเรียนรู้เชิงลึก ซึ่งเป็นหมวดหมู่ที่พบบ่อยที่สุดของปัญญาประดิษฐ์ในปัจจุบัน อิงจากโครงข่ายประสาทเทียมที่ใช้โหนดคอมพิวเตอร์ที่มีลักษณะคล้ายเซลล์ประสาท ซึ่งจัดเรียงเป็นชั้นๆ ก่อนที่มันจะสามารถทำงานได้ เช่น การจำแนกภาพเป็นแมวหรือสุนัข โครงข่ายประสาทเทียมต้องได้รับการฝึกอบรม โหนดชั้นแรกจะได้รับอิมเมจอินพุตของแมวหรือสุนัข โหนดจะตรวจจับคุณสมบัติต่างๆ ของภาพ และไฟจะดับหรืออยู่นิ่ง โดยส่งผ่านอินพุตเหล่านี้ไปยังโหนดชั้นที่สอง แต่ละโหนดในแต่ละเลเยอร์จะเริ่มทำงานหากอินพุตจากเลเยอร์ก่อนหน้านั้นสูงพอ มีหลายเลเยอร์ดังกล่าว และในตอนท้าย เลเยอร์สุดท้ายจะแสดงคำตัดสิน: “cat” หรือ “dog” การเชื่อมต่อแต่ละครั้งมี “น้ำหนัก” ที่แตกต่างกัน ตัวอย่างเช่น โหนด A และโหนด B อาจฟีดเอาต์พุตไปยังโหนด C จากนั้น C อาจเริ่มทำงานหรือไม่ก็ได้ ทั้งนี้ขึ้นอยู่กับสัญญาณ อย่างไรก็ตาม การเชื่อมต่อ AC อาจมีน้ำหนัก 3 และการเชื่อมต่อ BC น้ำหนัก 5 ในกรณีนี้ B มีอิทธิพลมากกว่า C มากกว่า เพื่อให้ตัวอย่างที่เข้าใจง่ายเกินไป A อาจยิงหากสิ่งมีชีวิตในภาพมีความคมชัด ฟัน ในขณะที่ B อาจยิงได้หากสิ่งมีชีวิตนั้นมีจมูกยาว เนื่องจากความยาวของจมูกมีประโยชน์มากกว่าความคมของฟันในการแยกสุนัขออกจากแมว C ให้ความสำคัญกับ B มากกว่า A โหนดแต่ละโหนดมีธรณีประตูที่จะยิงเพื่อส่งสัญญาณไปยังตัวเอง การเชื่อมต่อปลายน้ำ สมมุติว่า C มีธรณีประตูเป็น 7 แล้วถ้าไฟ A เท่านั้น มันจะอยู่เงียบๆ ถ้าเพียง B ยิง มันจะอยู่เงียบ; แต่ถ้า A และ B ยิงพร้อมกัน สัญญาณที่ส่งไปยัง C จะเพิ่มขึ้นเป็น 8 และ C จะเริ่มทำงาน ซึ่งจะส่งผลต่อเลเยอร์ถัดไป ทั้งหมดนี้เกี่ยวข้องกับการฝึกอบรมอย่างไร? รูปแบบการเรียนรู้ใด ๆ จะต้องสามารถแยกแยะระหว่างคำตอบที่ถูกต้องและไม่ถูกต้อง และปรับปรุงตัวเองตามนั้น หากโครงข่ายประสาทเทียมแสดงรูปภาพของสุนัข และแสดงผลเป็น “สุนัข” การเชื่อมต่อที่ยิงออกมาจะแข็งแกร่งขึ้น ผู้ที่ไม่ทำอย่างนั้นจะอ่อนกำลังลง หากเอาต์พุต “cat” ไม่ถูกต้อง การย้อนกลับจะเกิดขึ้น: การเชื่อมต่อที่ยิงออกจะอ่อนลง ผู้ที่ไม่ได้รับความเข้มแข็ง การฝึกอบรมโครงข่ายประสาทเทียมเพื่อแยกแยะว่ารูปถ่ายเป็นของแมวหรือสุนัขใช้ส่วนของโหนดและการเชื่อมต่อในเครือข่าย . การใช้เทคนิคที่เรียกว่าการรวมน้ำหนักแบบยืดหยุ่น เครือข่ายสามารถฝึกได้ในงานที่แตกต่างกัน โดยแยกแยะภาพรถยนต์จากรถโดยสาร การเชื่อมต่อที่สำคัญจากงานดั้งเดิมนั้น “ถูกระงับ” และการเชื่อมต่อใหม่ถูกสร้างขึ้น [blue, at right] ส่วนเล็ก ๆ ของการเชื่อมต่อที่หยุดนิ่งซึ่งอาจใช้สำหรับงานที่สองนั้นไม่พร้อมใช้งาน [purple, right diagram] ที่ลดลงเล็กน้อย ประสิทธิภาพในการทำงานที่สอง แต่ลองนึกภาพว่าคุณใช้โครงข่ายประสาทเทียมสำหรับสุนัขและแมวและตอนนี้เริ่มฝึกเพื่อแยกแยะรถบัสออกจากรถ การฝึกอบรมก่อนหน้านี้ทั้งหมดจะไม่มีประโยชน์ ผลที่ได้จะตอบสนองต่อภาพรถจะ สุ่มในตอนแรก แต่เมื่อฝึกแล้ว มันจะถ่วงน้ำหนักการเชื่อมต่อและค่อยๆ มีประสิทธิภาพ ในที่สุด จะสามารถจำแนกรถโดยสารและรถยนต์ได้อย่างแม่นยำมาก ณ จุดนี้ ถ้าคุณแสดงภาพสุนัขให้ภาพสุนัขดู โหนดทั้งหมดจะได้รับการชั่งน้ำหนักใหม่ และจะมี “ลืม” ทุกสิ่งที่เคยเรียนรู้มาก่อนหน้านี้ นี่เป็นการลืมอย่างหายนะ และเป็นสาเหตุส่วนใหญ่ที่ทำให้การเขียนโปรแกรมโครงข่ายประสาทเทียมด้วยความฉลาดที่ยืดหยุ่นเหมือนมนุษย์เป็นเรื่องยากมาก “หนึ่งในนั้นของเรา คลา ตัวอย่าง ssic คือการฝึกตัวแทนให้เล่นปิงปอง” Hadsell กล่าว คุณสามารถให้มันเล่นเพื่อที่จะชนะทุกเกมกับคอมพิวเตอร์ 20 ถึงศูนย์เธอกล่าว; แต่ถ้าคุณรบกวนน้ำหนักเพียงเล็กน้อย เช่น การฝึกบน Breakout หรือ Pac-Man “แล้วการแสดงจะ—บู๊!—หลุดจากหน้าผา” ทันใดนั้นจะสูญเสีย 20 ถึงศูนย์ทุกครั้ง จุดอ่อนนี้ก่อให้เกิดอุปสรรคสำคัญ ไม่เพียงแต่สำหรับเครื่องจักรที่สร้างขึ้นเพื่อให้ประสบความสำเร็จในงานต่างๆ ที่หลากหลาย แต่ยังรวมถึงระบบ AI ใดๆ ที่มีไว้เพื่อปรับให้เข้ากับสถานการณ์ที่เปลี่ยนแปลงไปในโลกรอบตัวด้วยการเรียนรู้กลยุทธ์ใหม่ตามความจำเป็น มีวิธีแก้ไขปัญหา สิ่งหนึ่งที่ชัดเจนคือการปิดแต่ละทักษะ ฝึกโครงข่ายประสาทเทียมของคุณในงานเดียว บันทึกน้ำหนักของเครือข่ายลงในการจัดเก็บข้อมูล จากนั้นฝึกกับงานใหม่ ช่วยลดน้ำหนักเหล่านั้นไว้ที่อื่น จากนั้นระบบจะต้องรับรู้เฉพาะประเภทของความท้าทายในตอนแรกและใช้ชุดตุ้มน้ำหนักที่เหมาะสม แต่กลยุทธ์นั้นมีจำกัด ประการหนึ่ง มันไม่สามารถปรับขนาดได้ หากคุณต้องการสร้างหุ่นยนต์ที่สามารถทำงานได้หลายอย่างในสภาพแวดล้อมที่หลากหลาย คุณจะต้องฝึกหุ่นยนต์กับหุ่นยนต์ทุกตัว และถ้าสภาพแวดล้อมไม่มีโครงสร้าง คุณจะไม่รู้ด้วยซ้ำว่างานเหล่านั้นจะเป็นอย่างไร ปัญหาอีกประการหนึ่งคือกลยุทธ์นี้ไม่อนุญาตให้หุ่นยนต์ถ่ายทอดทักษะที่ได้รับจากการแก้ปัญหา A ไปยังภารกิจ B ความสามารถในการถ่ายทอดความรู้ดังกล่าวถือเป็นจุดเด่นที่สำคัญของการเรียนรู้ของมนุษย์ แนวทางที่ต้องการของ Hadsell คือสิ่งที่เรียกว่า “การรวมน้ำหนักแบบยืดหยุ่น” สาระสำคัญคือ หลังจากเรียนรู้งานแล้ว โครงข่ายประสาทเทียมจะประเมินว่าการเชื่อมต่อแบบไซแนปส์ไลค์ใดระหว่างโหนดคล้ายเซลล์ประสาทที่สำคัญที่สุดสำหรับงานนั้น และจะทำให้น้ำหนักของพวกมันหยุดนิ่งบางส่วน “จะมีจำนวนค่อนข้างน้อย” เธอกล่าว “พูดสิ ร้อยละ 5” จากนั้นคุณปกป้องตุ้มน้ำหนักเหล่านี้ ทำให้เปลี่ยนยากขึ้น ในขณะที่โหนดอื่นสามารถเรียนรู้ได้ตามปกติ ตอนนี้ เมื่อ AI ที่เล่นปิงปองของคุณเรียนรู้ที่จะเล่น Pac-Man เซลล์ประสาทที่เกี่ยวข้องกับ Pong มากที่สุดจะยังคงอยู่ในตำแหน่งเดิม และจะยังคงทำได้ดีพอสำหรับ Pong มันอาจจะไม่ชนะด้วยคะแนน 20 ถึงศูนย์ แต่อาจจะ 18 ถึง 2 Raia Hadsell [top] เป็นผู้นำทีมหุ่นยนต์ที่ DeepMind ในลอนดอน ที่ OpenAI นักวิจัยใช้การจำลองเพื่อฝึกมือหุ่นยนต์ [above] เพื่อแก้ Rubik’s Cube ด้านบน: DeepMind; ด้านล่าง: OpenAI อย่างไรก็ตามมีผลข้างเคียงที่ชัดเจน ทุกครั้งที่โครงข่ายประสาทของคุณเรียนรู้งาน เซลล์ประสาทจำนวนมากขึ้นจะไม่ยืดหยุ่น ถ้าพงษ์ซ่อมเซลล์ประสาทบางส่วน และฝ่าวงล้อมแก้ไขเพิ่มเติม “ในที่สุด เมื่อตัวแทนของคุณเรียนรู้เกม Atari ก็จะได้รับการแก้ไขมากขึ้นเรื่อยๆ พลาสติกน้อยลงเรื่อยๆ” Hadsell อธิบาย ซึ่งคล้ายกับการเรียนรู้ของมนุษย์โดยคร่าวๆ เมื่อเรายังเด็ก เราเก่งในการเรียนรู้สิ่งใหม่ๆ เมื่อเราอายุมากขึ้น เราจะเก่งขึ้นในสิ่งที่เราได้เรียนรู้ แต่พบว่ามันยากกว่าที่จะเรียนรู้ทักษะใหม่ๆ “ทารกเริ่มมีความสัมพันธ์ที่แน่นแฟ้นมากขึ้นซึ่งอ่อนแอกว่ามาก” Hadsell กล่าว “เมื่อเวลาผ่านไป การเชื่อมต่อเหล่านั้นจะเบาบางลงแต่แข็งแกร่งขึ้น ช่วยให้คุณมีความทรงจำ แต่ก็จำกัดการเรียนรู้ของคุณด้วย” เธอคาดการณ์ว่าสิ่งนี้อาจช่วยอธิบายได้ว่าทำไมเด็กเล็กถึงไม่มีความทรงจำ: “รูปแบบสมองของเราไม่สนับสนุนมัน” ในเด็กที่อายุน้อยมาก “ทุกสิ่งทุกอย่างถูกลืมอย่างหายนะตลอดเวลา เพราะทุกสิ่งทุกอย่างเชื่อมโยงกันและไม่มีอะไรได้รับการปกป้อง” ปัญหาการสูญเสียความยืดหยุ่นคือ Hadsell คิดว่าสามารถแก้ไขได้ เธอทำงานร่วมกับทีม DeepMind มาตั้งแต่ปี 2018 ในเทคนิคที่เรียกว่า “ความคืบหน้าและการบีบอัด” มันเกี่ยวข้องกับการรวมแนวคิดล่าสุดสามประการในการเรียนรู้ของเครื่อง: โครงข่ายประสาทโปรเกรสซีฟ การกลั่นความรู้ และการรวมน้ำหนักแบบยืดหยุ่น ดังที่อธิบายไว้ข้างต้น โครงข่ายประสาทแบบก้าวหน้าเป็นวิธีที่ตรงไปตรงมาในการหลีกเลี่ยงการลืมอย่างหายนะ แทนที่จะมีโครงข่ายประสาทเทียมเพียงเครือข่ายเดียวที่ฝึกในงานหนึ่งและอีกงานหนึ่ง คุณมีโครงข่ายประสาทเทียมหนึ่งโครงข่ายที่ฝึกบนงาน เช่น การฝ่าวงล้อม จากนั้น เมื่อเสร็จสิ้นการฝึก มันจะหยุดการเชื่อมต่อ ย้ายโครงข่ายประสาทเทียมนั้นไปยังที่เก็บข้อมูล และสร้างโครงข่ายประสาทเทียมใหม่เพื่อฝึกฝนงานใหม่ เช่น Pac-Man ความรู้เกี่ยวกับงานก่อนหน้านี้แต่ละงานถูกแช่แข็งไว้ ​​ดังนั้นจึงไม่สามารถลืมได้ และเมื่อมีการสร้างโครงข่ายประสาทเทียมใหม่แต่ละโครงข่าย มันจะนำการเชื่อมต่อจากเกมก่อนหน้านี้ที่ฝึกมา เพื่อให้สามารถถ่ายทอดทักษะจากงานเก่าไปสู่งานใหม่ได้ แต่ Hadsell กล่าวว่ามีปัญหาคือ ไม่สามารถถ่ายทอดความรู้จากทักษะใหม่ไปสู่ทักษะเก่าได้ “ถ้าฉันกลับไปเล่น Breakout อีกครั้ง ฉันไม่ได้เรียนรู้อะไรจากเกมนี้เลย [new]” เธอกล่าว “ไม่มีการโอนเงินย้อนหลัง” นั่นเป็นที่มาของการกลั่นความรู้ซึ่งพัฒนาโดยนักวิทยาศาสตร์คอมพิวเตอร์ชาวอังกฤษ – แคนาดาชื่อเจฟฟรีย์ฮินตัน มันเกี่ยวข้องกับการใช้โครงข่ายประสาทเทียมที่แตกต่างกันจำนวนมากที่ได้รับการฝึกฝนเกี่ยวกับงานและบีบอัดให้เป็นเครือข่ายเดียว โดยเฉลี่ยการทำนายของพวกเขา ดังนั้น แทนที่จะมีโครงข่ายประสาทจำนวนมาก แต่ละเครือข่ายได้รับการฝึกฝนในแต่ละเกม คุณมีเพียงสองโครงข่าย: โครงข่ายหนึ่งที่เรียนรู้สิ่งใหม่ๆ เกมที่เรียกว่า “คอลัมน์ที่ใช้งานอยู่” และเกมที่ประกอบด้วยการเรียนรู้ทั้งหมดจากเกมก่อนหน้านี้ เฉลี่ยออก เรียกว่า “ฐานความรู้” ขั้นแรก คอลัมน์ที่ใช้งานอยู่จะได้รับการฝึกอบรมเกี่ยวกับงานใหม่ ซึ่งก็คือช่วง “ความคืบหน้า” จากนั้นการเชื่อมต่อของคอลัมน์นั้นจะถูกเพิ่มไปยังฐานความรู้ และกลั่นกรอง ซึ่งเป็นช่วง “บีบอัด” ช่วยให้เห็นภาพทั้งสองเครือข่ายเป็นสองคอลัมน์อย่างแท้จริง แฮดเซลล์ทำ และวาดมันลงบนไวท์บอร์ดให้ฉันขณะที่เธอพูด หากคุณต้องการสร้างหุ่นยนต์ที่สามารถทำงานได้หลายอย่างในสภาพแวดล้อมที่หลากหลาย คุณจะต้องฝึกหุ่นยนต์กับหุ่นยนต์ทุกตัว ปัญหาคือ โดยการใช้การกลั่นความรู้เพื่อรวมโครงข่ายประสาทแต่ละโครงข่ายของระบบโครงข่ายประสาทโปรเกรสซีฟเข้าด้วยกัน คุณได้นำปัญหาของการลืมกลับเป็นหายนะ คุณจะเปลี่ยนน้ำหนักทั้งหมดของการเชื่อมต่อและทำให้ การฝึกอบรมก่อนหน้านี้ไร้ประโยชน์ เพื่อจัดการกับสิ่งนี้ Hadsell ได้เพิ่มการรวมน้ำหนักแบบยืดหยุ่น: ทุกครั้งที่คอลัมน์ที่ใช้งานอยู่ถ่ายโอนการเรียนรู้เกี่ยวกับงานเฉพาะไปยังฐานความรู้ โหนดจะตรึงโหนดที่สำคัญที่สุดสำหรับงานนั้นบางส่วน การมีโครงข่ายประสาทเทียมสองโครงข่าย ระบบของ Hadsell สามารถหลีกเลี่ยงปัญหาหลักเกี่ยวกับการรวมน้ำหนักแบบยืดหยุ่นได้ ซึ่งก็คือการเชื่อมต่อทั้งหมดจะหยุดในที่สุด ฐานความรู้อาจมีขนาดใหญ่เท่าที่คุณต้องการ ดังนั้นโหนดที่ตรึงไว้สองสามโหนดจึงไม่สำคัญ แต่คอลัมน์แอ็คทีฟอาจมีขนาดเล็กกว่ามาก และโครงข่ายประสาทเทียมที่มีขนาดเล็กกว่าสามารถเรียนรู้ได้เร็วและมีประสิทธิภาพมากกว่าเครือข่ายที่ใหญ่กว่า Hadsell กล่าวว่ารูปแบบความคืบหน้าและการบีบอัดจะช่วยให้ระบบ AI สามารถถ่ายทอดทักษะจากงานเก่าไปยังงานใหม่และจากงานใหม่กลับไปเป็นงานเก่าได้ในขณะที่ไม่เคยลืมอย่างหายนะหรือไม่สามารถเรียนรู้สิ่งใหม่ ๆ ได้ นักวิจัยคนอื่นกำลังใช้กลยุทธ์ที่แตกต่างกันเพื่อโจมตีปัญหาการลืมหายนะ มีวิธีการวิจัยอยู่ครึ่งโหลหรือมากกว่านั้น Ted Senator ผู้จัดการโครงการที่ Defense Advanced Research Projects Agency (DARPA) เป็นผู้นำกลุ่มที่ใช้เทคนิคที่มีแนวโน้มมากที่สุดอย่างหนึ่งที่เรียกว่าการเล่นซ้ำภายใน “มันเป็นแบบจำลองตามทฤษฎีที่ว่าสมองทำงานอย่างไร” วุฒิสมาชิกอธิบาย “โดยเฉพาะอย่างยิ่งบทบาทของการนอนหลับในการรักษาความทรงจำ” ทฤษฏีคือสมองของมนุษย์จะเล่นซ้ำความทรงจำของวันนั้น ทั้งในขณะตื่นและหลับ โดยกระตุ้นเซลล์ประสาทในรูปแบบที่คล้ายกับที่เกิดขึ้นในขณะที่มีประสบการณ์ที่สอดคล้องกัน การเปิดใช้งานใหม่นี้จะช่วยให้รูปแบบมีเสถียรภาพ ซึ่งหมายความว่าจะไม่ถูกเขียนทับอย่างง่ายดาย การเล่นซ้ำภายในทำสิ่งที่คล้ายกัน ในระหว่างงานการเรียนรู้ โครงข่ายประสาทเทียมจะสร้างรูปแบบการเชื่อมต่อและน้ำหนักขึ้นใหม่ โดยเลียนแบบวงจรการตื่น-หลับของกิจกรรมประสาทของมนุษย์อย่างหลวมๆ เทคนิคนี้ได้รับการพิสูจน์แล้วว่าค่อนข้างมีประสิทธิภาพในการหลีกเลี่ยงการลืมอย่างหายนะ มีอุปสรรคอีกมากมายที่ต้องเอาชนะในการแสวงหาการนำ AI ที่เป็นตัวเป็นตนมาสู่ชีวิตประจำวันของเราอย่างปลอดภัย “เรามีความก้าวหน้าอย่างมากในด้าน AI ที่เป็นสัญลักษณ์และขับเคลื่อนด้วยข้อมูล” Thrishantha Nanayakkara ผู้ซึ่งทำงานด้านวิทยาการหุ่นยนต์ที่ Imperial College London กล่าว “แต่เมื่อพูดถึงการติดต่อ เราล้มเหลวอย่างน่าสังเวช เราไม่มีหุ่นยนต์ที่ไว้ใจได้ว่าจะอุ้มแฮมสเตอร์อย่างปลอดภัย เราไม่สามารถวางใจให้หุ่นยนต์อยู่ใกล้คนชราหรือเด็กได้” [robots] นานายักการะชี้ให้เห็นว่า “การแปรรูป” ส่วนใหญ่ที่ช่วยให้สัตว์จัดการกับโลกนั้นไม่ได้เกิดขึ้นในสมอง แต่เกิดขึ้นที่ส่วนอื่นๆ ของร่างกาย ตัวอย่างเช่น รูปร่างของช่องหูของมนุษย์ทำงานเพื่อแยกคลื่นเสียงออก โดยพื้นฐานแล้วจะแสดง “ชุดฟูริเยร์ในแบบเรียลไทม์” มิฉะนั้นการประมวลผลจะต้องเกิดขึ้นในสมองด้วยค่าใช้จ่ายไมโครวินาทีอันมีค่า “ถ้าเมื่อคุณได้ยินสิ่งต่าง ๆ พวกมันไม่อยู่ที่นั่นแล้ว แสดงว่าคุณไม่ได้ถูกฝังอยู่ในสิ่งแวดล้อม” เขากล่าว แต่ปัจจุบันโรบ็อตส่วนใหญ่อาศัยซีพียูในการประมวลผลอินพุตทั้งหมด ซึ่งเป็นข้อจำกัดที่เขาเชื่อว่าจะต้องเอาชนะให้ได้ก่อนที่จะมีความคืบหน้าอย่างมาก คุณรู้ไหมว่าแมวไม่มีวันเรียนภาษา และฉันก็ไม่เป็นไร เพื่อนร่วมงานของเขา Petar Kormushev กล่าวว่าปัญหาอีกประการหนึ่งคือการรับรู้ทางร่างกาย ซึ่งเป็นความรู้สึกของหุ่นยนต์ที่มีต่อร่างกายของมันเอง แบบจำลองของหุ่นยนต์ที่มีขนาดและรูปร่างเป็นของตัวเองนั้นถูกตั้งโปรแกรมโดยมนุษย์โดยตรง ปัญหาคือเมื่อมันหยิบของหนักขึ้นมา มันไม่มีทางที่จะปรับปรุงภาพลักษณ์ของตัวเองได้ เมื่อเราหยิบค้อนขึ้นมา เราจะปรับแบบจำลองทางจิตใจเกี่ยวกับรูปร่างและน้ำหนักของร่างกาย ซึ่งช่วยให้เราใช้ค้อนเป็นส่วนขยายของร่างกายได้ “ฟังดูไร้สาระ แต่พวกเขา [robots] ไม่สามารถอัปเดตโมเดลจลนศาสตร์ได้” เขากล่าว เขาตั้งข้อสังเกตว่าทารกแรกเกิดทำการเคลื่อนไหวแบบสุ่มโดยให้ข้อเสนอแนะไม่เพียง แต่เกี่ยวกับโลก แต่เกี่ยวกับร่างกายของพวกเขาเอง เขาเชื่อว่าเทคนิคที่คล้ายคลึงกันบางอย่างจะใช้ได้กับหุ่นยนต์ ที่มหาวิทยาลัยอ็อกซ์ฟอร์ด Ingmar Posner กำลังทำงานเกี่ยวกับ “อภิปัญญา” เวอร์ชันหุ่นยนต์ ความคิดของมนุษย์มักถูกจำลองว่ามี “ระบบ” หลักสองระบบ นั่นคือระบบที่ 1 ซึ่งตอบสนองอย่างรวดเร็วและเป็นธรรมชาติ เช่น เมื่อเราจับลูกบอลหรือตอบคำถามเช่น “ข้อใดในสองบล็อกนี้เป็นสีฟ้า” และระบบที่ 2 ซึ่งตอบสนอง ช้าลงและใช้ความพยายามมากขึ้น มันมีผลเมื่อเราเรียนรู้งานใหม่หรือตอบคำถามทางคณิตศาสตร์ที่ยากขึ้น Posner ได้สร้างระบบการทำงานที่เทียบเท่าใน AI ในมุมมองของเขา หุ่นยนต์มีความมั่นใจในตัวเองมากเกินไปหรือน้อยเกินไป และต้องการวิธีการรู้เมื่อไม่รู้อะไรบางอย่าง “มีบางสิ่งในสมองของเราที่ตรวจสอบการตอบสนองของเราเกี่ยวกับโลก มีบางอย่างที่บอกว่าอย่าเชื่อการตอบสนองโดยสัญชาตญาณของคุณ” เขากล่าว สำหรับนักวิจัยส่วนใหญ่เหล่านี้ รวมถึง Hadsell และเพื่อนร่วมงานของเธอที่ DeepMind เป้าหมายระยะยาวคือความฉลาด “ทั่วไป” อย่างไรก็ตาม แนวคิดของ Hadsell เกี่ยวกับปัญญาประดิษฐ์ทั่วไปนั้นไม่ธรรมดา—ของ AI ที่สามารถทำงานทางปัญญาทั้งหมดที่มนุษย์สามารถทำได้ และอื่นๆ การจูงใจให้งานของเธอ “ไม่เคยมีแนวคิดในการสร้างความฉลาดหลักแหลมเช่นนี้มาก่อน” เธอกล่าว “ยิ่งไปกว่านั้น: เราจะมีวิธีทั่วไปในการพัฒนาความฉลาดในการแก้ปัญหาโดยเฉพาะได้อย่างไร” ยกตัวอย่างเช่น ความฉลาดของแมว โดยทั่วไปแล้วจะไม่พบปัญหาใหม่ที่ทำให้ค้างหรือล้มเหลว “ฉันพบว่าระดับความฉลาดของสัตว์นั้นเกี่ยวข้องกับความว่องไวอย่างไม่น่าเชื่อในโลก ผสมผสานรูปแบบทางประสาทสัมผัสต่างๆ น่าดึงดูดจริงๆ คุณรู้ไหมว่าแมวจะไม่มีวันเรียนรู้ภาษา และฉันก็ไม่เป็นไร” Hadsell ต้องการสร้างอัลกอริธึมและหุ่นยนต์ที่สามารถเรียนรู้และรับมือกับปัญหามากมายในพื้นที่เฉพาะ หุ่นยนต์ที่ตั้งใจจะทำความสะอาดหลังจากอุบัติเหตุทางนิวเคลียร์ เช่น อาจมีเป้าหมายที่ค่อนข้างสูง – “ทำให้พื้นที่นี้ปลอดภัย” – และสามารถแบ่งออกเป็นเป้าหมายย่อยที่เล็กกว่าได้ เช่น การค้นหาวัสดุกัมมันตภาพรังสีและกำจัดออกอย่างปลอดภัย . อดไม่ได้ที่จะถามถึงสติสัมปชัญญะ นักวิจัย AI บางคนรวมถึงเพื่อนร่วมงาน DeepMind ของ Hadsell Murray Shanahan สงสัยว่าจะเป็นไปไม่ได้ที่จะสร้าง AI ที่เป็นตัวเป็นตนของหน่วยสืบราชการลับทั่วไปที่แท้จริงโดยที่เครื่องไม่มีสติ แม้ว่าแฮดเซลตัวเองจะมีพื้นฐานด้านปรัชญาศาสนามาก่อน แต่ก็มีวิธีปฏิบัติที่ได้ผลจริง “ฉันมีมุมมองที่ค่อนข้างง่ายเกี่ยวกับความรู้สึกตัว” เธอกล่าว สำหรับเธอ สติหมายถึงความสามารถในการคิดนอกช่วงเวลาที่แคบของ “ตอนนี้”—ใช้ความทรงจำเพื่อเข้าถึงอดีต และใช้จินตนาการในการมองเห็นอนาคต มนุษย์เราทำได้ดี สิ่งมีชีวิตอื่นๆ น้อยกว่า: ดูเหมือนว่าแมวจะมีระยะเวลาที่สั้นกว่าเรา โดยที่วางแผนสำหรับอนาคตน้อยกว่า แมลงน้อยลง เธอไม่กระตือรือร้นที่จะดึงเอาปัญหายากๆ ของการมีสติสัมปชัญญะและแนวคิดทางปรัชญาอื่นๆ อันที่จริง นักวิทยาการหุ่นยนต์ส่วนใหญ่ดูเหมือนจะต้องการหลีกเลี่ยง Kormushev เปรียบเสมือนการถามว่า “เรือดำน้ำสามารถว่ายน้ำได้หรือไม่ … การอภิปรายไม่มีประโยชน์ ตราบใดที่พวกเขาทำในสิ่งที่ฉันต้องการ เราก็ไม่ต้องทรมานตัวเองด้วยคำถาม” การกดหมุดรูปดาวลงในรูรูปดาวอาจดูเหมือนง่าย แต่มันเป็นชัยชนะเล็กน้อยสำหรับหุ่นยนต์ตัวใดตัวหนึ่งของ DeepMindDeepMind ในห้องปฏิบัติการหุ่นยนต์ DeepMind นั้นง่ายที่จะเห็นว่าเหตุใดคำถามประเภทนี้จึงไม่อยู่ด้านหน้าและตรงกลาง ความพยายามของหุ่นยนต์ในการหยิบบล็อกแนะนำว่าเราไม่ต้องกังวลเกี่ยวกับประเด็นทางปรัชญาที่เกี่ยวข้องกับจิตสำนึกประดิษฐ์ อย่างไรก็ตาม ระหว่างที่เดินไปรอบๆ แล็บ ฉันพบว่าตัวเองกำลังเชียร์หนึ่งในนั้น แขนหุ่นยนต์สีแดงพยายามกระตุกเพื่อหยิบก้อนอิฐรูปดาวแล้วสอดเข้าไปในช่องรับแสงรูปดาวอย่างที่เด็กวัยหัดเดินทำได้ ในความพยายามครั้งที่สอง อิฐจะเรียงชิดกันและใกล้จะวางลงในช่อง ฉันพบว่าตัวเองกำลังตะโกนว่า “มาเลย ไอ้หนู!” ยั่วให้เลิกคิ้วขึ้นจากแฮดเซลล์ จากนั้นจึงวางอิฐเข้าที่สำเร็จ เสร็จไปหนึ่งงาน อย่างน้อย ตอนนี้มันแค่ต้องยึดติดกับกลยุทธ์นั้นในขณะที่เรียนรู้การเล่นปิงปอง บทความนี้ปรากฏในฉบับพิมพ์เดือนตุลาคม 2564 ในชื่อ “How to Train an All-Purpose Robot” บ้าน

  • ลดน้ำหนัก (ลดน้ำหนัก)
  • (อ้วน)
  • อาหารทางโภชนาการ (โภชนาการ)
  • อาหาร (อาหาร)
  • อาหารปลอดสารพิษ (Organic food)
  • (อาหารจานด่วน)

    Back to top button