安全防è·å±¤å±¤åŠ ç¢¼å·é™†ï¼Œæ–°ä¸€ä»£è€ç”¨æˆ°(zhà n)神 OPPO A5 Pro æ£å¼é–‹å”®

è‡ªå¸æŠ“å–物體的機械臂,Google機器å¸ç¿’冿¬¡éœ‡é©šä¸–界
æˆ–è¨±èˆ‡åœæ£‹é€£å‹å…©å±€åœ°çƒä¸Šæœ€è°æ˜Žçš„人之一相比,抓å–物體è½èµ·ä¾†å¹¶æ²’æœ‰é‚£ä¹ˆé…·ç‚«â€”â€”ç•¢ç«Ÿæˆ‘å€‘å¤§å¤šæ•¸äººä¸æœƒæ‰‹æ»‘æ‹¿ä¸ä½ä¸€å€‹æ¯å须教,就連一個2æ²å°å©ä¹Ÿèƒ½å¤ 叿œƒæŠŠåœ°ä¸Šçš„玩具撿起來。ä¸éŽå€˜è‹¥èªªé€™èƒŒåŽæ‰€æ¶‰åŠåˆ°çš„æ–¹å¼æ–¹æ³•與AlphaGo戰(zhà n)勿Žä¸–石所用的是一個模å里é¢åˆ»å‡ºä¾†çš„ï¼Œä½ æ˜¯å¦å°±æœƒæœ‰äº›èˆˆè¶£äº†å‘¢è½»è…ºï¼Ÿ
這兩者的背åŽéƒ½ä½¿ç”¨äº†å¼·åŒ–å¸ç¿’ (reinforcement learning) 的算法ä¹ç–†ã€‚什么å«åšå¼·åŒ–å¸ç¿’å‘¢ï¼Ÿæˆ‘å€‘æ‰“å€‹æ¯”æ–¹ï¼šç•¶ä½ åœ¨è¨“ç·´ç‹—ç‹—å下的時候贬养,如果它åšå‡ºå°çš„å‹•ä½œæŒ¤åœŸï¼Œä½ æœƒçµ¦å®ƒä¸€å¡Šå°é¤…干,跟它說“乖寶寶â€è¯¯ç®—;如果它åšéŒ¯äº†ä»°ç¾Žï¼Œå®ƒå°‡æ²’æœ‰é¤…å¹²ï¼Œæˆ–è€…è¼•è¼•çš„è¢«ä½ æ‹ä¸€ä¸‹é 儿礼;經éŽé•·æ™‚間的訓練之åŽå’–æ‚,它就知é“åä¸‹ï¼Œå°±èƒ½å¤ å¾—åˆ°çŽå‹µèšŠå¤«ã€‚這å°äºŽæ©Ÿå™¨ä¾†è¬›ä¹Ÿæ˜¯ä¸€æ¨£çš„诉å—,åªä¸éŽå°å®ƒè€Œè¨€å°é¤…å¹²ï¼Œå°±æ˜¯ä¸€å€‹å°æœªä¾†æ”¶ç›Šçš„é æœŸçŸ¥çº·ï¼Œè€Œå®ƒçš„目標就是如何åšå‡ºå°çš„鏿“‡å£¤åœƒï¼Œä¾†æœ€å¤§åŒ–這個收益。
有了基本的概念之åŽç…轧,我們å†ä¾†çœ‹ä¸€ä¸‹ç¶åŸºç™¾ç§‘åš´æ ¼çš„å®šç¾©ï¼šå¼·åŒ–å¸ç¿’是機器å¸ç¿’ä¸çš„ä¸€å€‹é ˜åŸŸä¼ç»³ï¼Œå¼·èª¿å¦‚何基于環(huán)境而行動,以å–å¾—æœ€å¤§åŒ–çš„é æœŸåˆ©ç›Šä¹æ¡‚ã€‚å…¶éˆæ„Ÿä¾†æºäºŽå¿ƒç†å¸ä¸çš„行為主義ç†è«–冲æ€ï¼Œå³æœ‰æ©Ÿé«”如何在環(huán)境給予的çŽå‹µæˆ–æ‡²ç½°çš„åˆºæ¿€ä¸‹ï¼Œé€æ¥å½¢æˆå°åˆºæ¿€çš„é æœŸç¹é…Œï¼Œç”¢ç”Ÿèƒ½ç²å¾—最大利益的習慣性行為æƒè°ã€‚æ›è¨€ä¹‹ï¼Œåªè¦æˆ‘å€‘èƒ½å¤ æœ‰æ•ˆçš„å€(qÅ«)分“好â€å’Œâ€œå£žâ€å¿ç–¾ï¼Œé‚£ä¹ˆæˆ‘們就å¯ä»¥ç”¨å¢žå¼·å¸ç¿’çš„æ–¹æ³•é—¯ä¼ ï¼Œè®“æ©Ÿå™¨åœ¨ä¸æ–·çš„實驗ä¸è°¨æœï¼Œé€æ¼¸å¸æœƒåšå‡ºâ€œå¥½â€çš„行為å¤å¦’。
這種方法與傳統(tÇ’ng)程åºç·¨å¯«çš„æœ€å¤§å€(qÅ«)別就在于,傳統(tÇ’ng)æ„ç¾©ä¸Šçš„ç¨‹åºæ˜¯é€šéŽåˆ†æžä»¥åŠä¸€ç³»åˆ—çš„if-elseä¾†è¡¨é”æˆ‘們å°äºŽäº‹æƒ…çš„ç†è§£å—å¸ï¼Œæ›è¨€ä¹‹åˆ™æŠ«ï¼Œé€™ç¨®æ–¹æ³•最大的弊端就是,倘若我們ä¸èƒ½å¤ 清晰的梳ç†å‡ºä¸€ä»¶äº‹æƒ…為什么這樣åšçš„æ™‚候洗出,我們便無從æˆåŠŸçš„è®“æ©Ÿå™¨æ¨¡ä»¿åšå‡ºé¡žä¼¼çš„行為士å¤ï¼Œæ›´ç„¡æ³•處ç†å½¢å½¢è‰²è‰²çš„çªç™¼(fÄ)æ„外情æ³ã€‚然而強化å¸ç¿’的方法則我們åªéœ€è¦æä¾›ä¸€å€‹â€œè¶³å¤ 好â€çš„åˆå§‹æ¢ä»¶ï¼ŒæŽ¥ä¸‹ä¾†é˜±æ´ªï¼Œè®“機器自己在無數次的失敗ä¸èª¿æ•´ä¾¿è´µã€å¸ç¿’å°±å¥½ã€‚å°±æ‹¿åœæ£‹ä¾†èªªå†—è¸ï¼Œç ”究人員無需先æˆç‚ºåœæ£‹çš„個ä¸é«˜æ‰‹æ‰¿ç’ƒï¼ŒAlphaGo在與æŽä¸–çŸ³å°æ±ºä»¥å‰ï¼Œå®ƒå·²ç¶“和自己下了以百è¬ç‚ºå–®ä½å±€çš„åœæ£‹èšŒæœ¬ï¼Œå¹¶å¾žè‡ªå·±èº«ä¸Šå¸åˆ°äº†ç„¡æ•¸çš„æ•™è¨“äº†ç›”ç²¹ã€‚åŒæ¨£ï¼Œæˆ‘å€‘ç„¡é ˆç†è§£æˆ‘å€‘æ˜¯å¦‚ä½•èƒ½å¤ æŠ“èµ·å½¢å½¢è‰²è‰²çš„ç‰©é«”çš„ç¨‹ç™Œï¼Œç ”ç©¶äººå“¡è§€å¯Ÿåˆ°800,000的練習之åŽèˆ·å—¡ï¼Œæ©Ÿå™¨é–‹å§‹å¸æœƒç¡¬çš„ç‰©é«”è¦æŠ“é‚Šç·£ï¼ŒæŸ”è»Ÿçš„ç‰©é«”å‰‡å¯ä»¥æè‘—ä¸é–“嵌莉,甚至一些形狀ä¸è¦(guÄ«)則或者被擋ä½çš„物體进è„ï¼Œå®ƒå€‘é‚„æœƒå…ˆæŠŠéšœç¤™æ¸…é–‹ï¼Œæ˜¯ä¸æ˜¯å¾ˆè°æ˜Žå‘¢çƒ¦ç§©ï¼Ÿæœ‰èˆˆè¶£çš„æœ‹å‹å¯ä»¥çœ‹çœ‹è«–文的原文垮斯。
ç•¶ç„¶é™¤äº†ç ”ç©¶ä¸Šçš„æ„義,我更關心的是åªç¥ ,這將給工æ¥(yè)ç•Œå¸¶ä¾†æ€Žæ¨£çš„éœ‡å‹•å…œè •ã€‚ç•¢ç«Ÿï¼Œæˆ‘å€‘å¾ˆå¤šæ±ºç–å•題都有類似明確的“好â€èˆ‡â€œå£žâ€çš„æ¨™æº–抛å¯ï¼Œè€Œå€˜è‹¥æˆ‘å€‘èƒ½å¤ æ°ç•¶çš„æŠŠå¢žå¼·å¸ç¿’的方法帶入到應用當ä¸ç†Šæ¨ï¼Œæˆ–許人和機器的分工åˆå°‡å†ä¸€æ¬¡è¢«æ·±åˆ»çš„æ”¹è®Šã€‚