முக்கிய புதுமை கூகிள் செயற்கை நுண்ணறிவு 'ஆல்பா கோ ஜீரோ' எப்படி கற்றுக்கொள்வது என்பதை மீட்டமைக்கவும்

கூகிள் செயற்கை நுண்ணறிவு 'ஆல்பா கோ ஜீரோ' எப்படி கற்றுக்கொள்வது என்பதை மீட்டமைக்கவும்

நாளைக்கு உங்கள் ஜாதகம்

நீங்கள் எப்படி நடக்க, பேச, பைக் ஓட்ட, அல்லது வாகனம் ஓட்ட கற்றுக்கொண்டீர்கள் என்பதை நினைவில் கொள்க (தெளிவற்ற முறையில்)? இது குழப்பமானதாகவும், தவறுகள் நிறைந்ததாகவும் இருந்தது, ஆனால் நீங்கள் அந்த வழியில் கற்றுக்கொண்ட திறமைகள் அப்படியே இருந்தன. வாழ்க்கை முறைகளுக்கு வெளியே, 'நிஜ வாழ்க்கை அனுபவத்தை' எடுத்துக்கொள்வதற்கும், செயற்கை நுண்ணறிவுக்கான ஒட்டும், தகவமைப்பு நடத்தைகளை உருவாக்குவதற்கும் போதுமான வலுவான வழிமுறைகளை உருவாக்குவது சவாலானது.

சரி, ஆல்பா கோ ஜீரோ அதைச் செய்தது.

'இது ஒரு வெற்று ஸ்லேட்டில் இருந்து தொடங்கி, தனக்கு மட்டுமே, சுய விளையாட்டிலிருந்து மட்டுமே, மற்றும் எந்த மனித அறிவும் இல்லாமல், அல்லது எந்தவொரு மனித தரவு, அல்லது அம்சங்கள், எடுத்துக்காட்டுகள் அல்லது மனிதர்களின் தலையீடு இல்லாமல். முதல் கொள்கைகளிலிருந்து கோ விளையாட்டை எவ்வாறு விளையாடுவது என்பதை இது கண்டுபிடிக்கும் 'என்கிறார் டீப் மைண்டின் பேராசிரியர் டேவிட் சில்வர்.

AI க்கு பல மறு செய்கைகள் உள்ளன, ஒவ்வொன்றும் முந்தையதை விட சிறந்தவை மற்றும் திறமையானவை. முந்தைய பதிப்பானது முந்தைய கேம்களின் மிகப்பெரிய தரவுத்தளத்தைப் பயன்படுத்தி ஒரு சில வழிமுறைகளுடன் வென்றது. அந்த அணுகுமுறை உலக சாம்பியன் தொழில்முறை கோ வீரரின் தோல்விக்கு வழிவகுத்தது. போக்கரில், AI லிபிரட்டஸ் சமீபத்தில் உலகின் சிறந்த போக்கர் வீரர்களை கிட்டத்தட்ட million 2 மில்லியனாகக் குறைத்தது, மேலும் மனித விளையாட்டுத் தரவுகளுக்குப் பதிலாக சுய-விளையாட்டின் மூலம் கற்றுக்கொள்வதன் மூலமும்.

சாரா ஹார்பாக்க்கு எவ்வளவு வயது

இப்போது, ​​ஆல்பா கோவின் இந்த சமீபத்திய பதிப்பில், செயற்கை நுண்ணறிவு திட்டம் கற்பித்தது தன்னை கோ விளையாடுவது எப்படி - மனித பின்னணி இல்லாமல்.

தனக்கு எதிராக மில்லியன் கணக்கான விளையாட்டு உருவகப்படுத்துதல்களை இயக்கி, அதைக் கற்றுக்கொள்ள 40 நாட்கள் ஆனது - புதிதாக - உலக சாம்பியன் பதிப்பை எவ்வாறு வெல்வது என்று. இது உண்மையிலேயே விளையாட்டு மாறும், இது கோவுக்கு மட்டுமல்ல, புதிய அறிவு எவ்வாறு கண்டறியப்படுகிறது என்பதற்கும் கூட. உங்கள் டொமைன் நிபுணத்துவம் எவ்வளவு துல்லியமானது அல்லது முழுமையானது? அங்கு தான் நிறைய ஆல்ஃபா கோ ஜீரோவுடன் கற்றலில் இந்த கண்கவர் சோதனை நமக்கு என்ன சொல்கிறது என்பதைக் கண்டறிய இன்னும் அதிகம்.

'ஆல்ஃபா கோவின் யோசனை வெளியே சென்று மனிதர்களைத் தோற்கடிப்பது அல்ல, ஆனால் உண்மையில் விஞ்ஞானம் செய்வதன் அர்த்தம் என்ன என்பதைக் கண்டுபிடிப்பது - ஒரு நிரல் அறிவு என்னவென்று தன்னிடமிருந்து கற்றுக்கொள்ள முடியும்' என்று சில்வர் ஒரு யூடியூப் பதிவில் சாதனை.

ஆல்பா கோ ஜீரோ டீப் மைண்ட் குழு இதை முதல் கொள்கை, 'தபுலா ராசா' (வெற்று ஸ்லேட்) கற்றல் என்று அழைக்கிறது.

'நீங்கள் சாதிக்க முடிந்தால் tabula rasa கற்றல், உங்களிடம் வேறு எந்த டொமைனுக்கும் கோ விளையாட்டிலிருந்து இடமாற்றம் செய்யக்கூடிய ஒரு முகவர் இருக்கிறார், மேலும் நீங்கள் இருக்கும் விளையாட்டின் பிரத்தியேகங்கள், நீங்கள் ஒரு வழிமுறையைக் கொண்டு வருகிறீர்கள், அது மிகவும் பொதுவானது, அது எங்கும் பயன்படுத்தப்படலாம், 'என்று அவர் கூறுகிறார் . நீங்கள் கருத்தை நீட்டிக்கும்போது அது ஒரு ஆத்திரமூட்டும் யோசனை. கடினமான சிக்கல்களை முறையாகக் கையாளக்கூடிய மற்றும் நமது நாகரிகத்தின் கூட்டு அறிவை விட விரைவாகக் கற்றுக்கொள்ளக்கூடிய வலுவான, கற்றல் வழிமுறைகளின் தொகுப்பால் நாம் என்ன செய்ய முடியும் என்று சற்று யோசித்துப் பாருங்கள். . . நாட்களில், பல தசாப்தங்களாக அல்ல.

ஜெய் அல்வார்ரெஸ் மற்றும் சேஸ் மில்லர்

இப்போதைக்கு, 'கணினி அல்லது கிடைக்கக்கூடிய தரவை விட வழிமுறைகள் மிக முக்கியமானவை' என்று சில்வர் கூறினார். அறியப்பட்ட உலகத்தை விரிவாக்குவதை நாம் எவ்வாறு அணுகலாம் என்பதில் இது ஒரு விளையாட்டு மாற்றியாகும். ஆல்பா கோ சுமார் million 25 மில்லியனுக்கும் அதிகமான வன்பொருளில் இயங்குகிறது - இது சரியாக இலகுரக அமைப்பு அல்ல - AI குருக்கள் நீண்ட காலமாக தூய்மையான, சிறந்த தரவுத் தொகுப்புகளை உருவாக்குவதில் பணியாற்றி வருகிறார்கள் என்பது உங்களுக்குத் தெரியும். இன்று, பல பெரிய தரவுத் தொகுப்புகள் மிகவும் சத்தமாகக் கருதப்படுகின்றன - மோசமான தரவு நிறைந்தவை - ஒரு செயற்கை நுண்ணறிவைத் துல்லியமாகப் பயிற்றுவிக்க. AI தரவுகளிலிருந்து கற்றுக்கொண்டால், தரவு மோசமாக இருந்தால், அது கற்றுக்கொள்ளாது. பெரிய பிரச்சனை.

உங்களுக்கு சுத்தமான தரவு தேவையில்லை, ஆனால் அனுபவம், மற்றும் செயற்கை நுண்ணறிவு தன்னைப் பயிற்றுவிக்க முடியுமா?

ஆல்பா கோ ஜீரோவில் இது ஒரு அற்புதமான சாதனை. இது விளையாட்டுகளின் முக்கிய, விதி அடிப்படையிலான உலகில் இருந்தாலும், இயற்பியல் விதிகளிலிருந்து செயல்படும் ஒவ்வொரு தொழிற்துறையிலும் இது பெரிய தாக்கங்களைக் கொண்டுள்ளது - வேதியியல், போக்குவரத்து, உயிரியல், மருந்தியல், பயணம், தளவாடங்கள் மற்றும் உற்பத்தி ஆகியவற்றை நினைத்துப் பாருங்கள். விதிமுறைகளை நாம் மிகவும் நெகிழ்வாக வடிவமைக்க முடிந்தால், அவை பரந்த அனுபவத்திலிருந்து செயல்பட முடியும், மேலும் அவை எப்போதும் வலுவான திறமையை உருவாக்குகின்றன - ஆல்பா கோ ஜீரோ போன்றவை - பின்னர் அமைப்புகளை சூத்திரதாரி செய்யும் செயற்கை நுண்ணறிவை அடைய முடியும். இந்த அமைப்புகளுக்கு வெளிப்புற தரவு எதுவும் தேவையில்லை, தரவு சுத்திகரிப்பு சிக்கல்கள் இல்லை, மேலும் மனித-இன்-லூப் மந்தநிலைகள் தேவையில்லை. அதனால்தான் கூகிளின் தாய் நிறுவனமான ஆல்பாபெட், செயற்கை நுண்ணறிவு குறித்து நிறுவனத்திற்கு பந்தயம் கட்டி, செயற்கை நுண்ணறிவில் விரைவான விகிதத்தில் முதலீடு செய்கிறது. (அமேசான் அதன் சமீபத்திய AI கையகப்படுத்தல் பாடி லேப்ஸைப் போலவே செயற்கை நுண்ணறிவிலும் முதலீடு செய்கிறது.)

ஜோ மங்கனியெல்லோ நிகர மதிப்பு 2015

டீப் மைண்ட் பேராசிரியர் டேவிட் சில்வர் கூறுகிறார், 'ஒரு நிரல் ஒரு உயர் மட்ட செயல்திறனை அடைவதை நாங்கள் கண்டிருக்கிறோம் ... இப்போது மனிதகுலத்திற்கு மிகவும் சவாலான மற்றும் தாக்கத்தை ஏற்படுத்தும் சில சிக்கல்களைச் சமாளிக்க ஆரம்பிக்கலாம்.'

மனித உள்ளிடப்பட்ட தரவை விட சுய-விளையாட்டை உள்ளடக்கிய ஒரு மூலோபாயத்தைப் பயன்படுத்தி AI லிபிரட்டஸ் சமீபத்தில் சிறந்த போக்கர் வீரர்களை வென்றது என்பதை தெளிவுபடுத்துவதற்காக இந்த இடுகை புதுப்பிக்கப்பட்டுள்ளது.

சுவாரசியமான கட்டுரைகள்