முக்கிய புதுமை கூகிளின் புதிய உரை-க்கு-பேச்சு AI மிகவும் நல்லது, நாங்கள் அதை ஒரு உண்மையான மனிதரிடமிருந்து சொல்ல முடியாது

கூகிளின் புதிய உரை-க்கு-பேச்சு AI மிகவும் நல்லது, நாங்கள் அதை ஒரு உண்மையான மனிதரிடமிருந்து சொல்ல முடியாது

நாளைக்கு உங்கள் ஜாதகம்

AI- உருவாக்கிய கணினி பேச்சுக்கும் உண்மையான, நேரடி மனிதனுக்கும் உள்ள வித்தியாசத்தை நீங்கள் சொல்ல முடியுமா? உங்களால் முடியும் என்று நீங்கள் எப்போதும் நினைத்திருக்கலாம். ஒருவேளை நீங்கள் அலெக்ஸா மற்றும் ஸ்ரீயை விரும்புகிறீர்கள், ஆனால் அவர்களில் ஒருவரையும் நீங்கள் ஒரு உண்மையான பெண்ணுடன் குழப்ப மாட்டீர்கள் என்று நம்புங்கள்.

விஷயங்கள் இன்னும் சுவாரஸ்யமானவை. கூகிள் பொறியாளர்கள் உரை-க்கு-பேச்சு முறையை உருவாக்கும் பணியில் கடினமாக உள்ளனர் டகோட்ரான் 2 . ஒரு படி காகிதம் அவர்கள் இந்த மாதத்தில் வெளியிட்டனர், கணினி முதலில் உரையின் ஸ்பெக்ட்ரோகிராமை உருவாக்குகிறது, பேச்சு எவ்வாறு ஒலிக்க வேண்டும் என்பதற்கான காட்சி பிரதிநிதித்துவம். அந்த படம் கூகிளின் தற்போதைய வேவ்நெட் அல்காரிதம் மூலம் வைக்கப்பட்டுள்ளது, இது மிகவும் இயல்பான மனித பேச்சை உருவாக்க படத்தைப் பயன்படுத்துகிறது.

ஆஸ்பின் மற்றும் பார்க்கர் வயது எவ்வளவு

இந்த முறையைப் பயன்படுத்தி, ஆராய்ச்சியாளர்கள் தெரிவிக்கையில், 'எங்கள் மாதிரி 4.53 என்ற சராசரி கருத்து மதிப்பெண்ணை (MOS) அடைகிறது, இது தொழில் ரீதியாக பதிவுசெய்யப்பட்ட பேச்சுக்கு 4.58 என்ற MOS உடன் ஒப்பிடத்தக்கது.' (ஒரு சராசரி கருத்து மதிப்பெண் என்பது ஒரு தொலைதொடர்பு காலமாகும், இது வாழ்க்கையில் இருந்து எதையாவது ஒலிக்கிறது என்பதை அளவிடும்.)

கூகிளின் ஆடியோ மாதிரிகள் நிரூபிக்கிறபடி, டகோட்ரான் 2 'பாலைவனம்' என்ற பெயர்ச்சொல் மற்றும் 'பாலைவனம்' என்ற வினைச்சொல்லுக்கும், அதே போல் 'நிகழ்காலம்' என்ற வினைச்சொல் மற்றும் 'தற்போது' என்ற வினைச்சொல்லுக்கும் இடையிலான வேறுபாட்டைக் கண்டறிந்து அதன் உச்சரிப்பை மாற்றியமைக்க முடியும். இது மூலதன சொற்களுக்கு முக்கியத்துவம் கொடுக்கலாம் மற்றும் ஒரு அறிக்கையை வெளியிடுவதை விட ஒரு கேள்வியைக் கேட்கும்போது சரியான ஊடுருவலைப் பயன்படுத்தலாம்.

மனித பேச்சுக்கு ஒத்ததாக இருக்கும் உரையை இது உருவாக்க முடியும், வித்தியாசத்தை அறிந்து கொள்வது கடினம் அல்லது சாத்தியமற்றது. இது எவ்வளவு கடினமானது என்பதை நீங்கள் காண விரும்பினால், Google க்குச் செல்லவும் ஆடியோ மாதிரிகள் பக்கம் , மற்றும் 'டகோட்ரான் 2 அல்லது மனிதனா?' என்ற தலைப்பில் கடைசி மாதிரிகள் வரை உருட்டவும். டகோட்ரான் 2 மற்றும் ஒரு உண்மையான நபரை நீங்கள் காணலாம், 'அந்த பெண் ஸ்டார் வார்ஸ் லிப்ஸ்டிக் பற்றி ஒரு வீடியோ செய்தார்.'

ஸ்பாய்லர் அலர்ட்: உங்களைச் சோதிக்க, மாதிரிகளைக் கேட்டு, இந்த நெடுவரிசையின் எஞ்சிய பகுதியைப் படிப்பதற்கு முன் இது யூகிக்கவும்.

எனவே எந்த மாதிரிகள் உரைக்கு பேச்சு மற்றும் உண்மையான மனித குரல்? கூகிளின் பொறியாளர்கள் சொல்லவில்லை, ஆனால் அவர்கள் மிகப் பெரிய துப்பு விட்டுவிட்டார்கள். .Wav கோப்பு மாதிரிகள் ஒவ்வொன்றிலும் 'gen' அல்லது 'gt' என்ற சொல் அடங்கிய கோப்பு பெயர் உள்ளது. தாளின் அடிப்படையில், டகோட்ரான் 2 ஆல் உருவாக்கப்பட்ட பேச்சை 'ஜென்' குறிக்கிறது, மற்றும் 'ஜி.டி' உண்மையான மனித பேச்சு. ('ஜி.டி' என்பது 'தரை உண்மை' என்பதைக் குறிக்கிறது, இது ஒரு இயந்திர கற்றல் சொல், அதாவது 'உண்மையான ஒப்பந்தம்' என்று பொருள்.)

இது சரியானது என்று கருதினால், சோதனைக்கான பதில்கள் இங்கே:

ஜாக் ஃபலாஹி ஒரு உறவில் இருக்கிறார்

'அந்த பெண் ஸ்டார் வார்ஸ் லிப்ஸ்டிக் பற்றி ஒரு வீடியோ செய்தார்.'

மாதிரி 1: உண்மையான மனித

மாதிரி 2: டகோட்ரான் 2

'அவர் கொலம்பியா பல்கலைக்கழகத்தில் சமூகவியலில் முனைவர் பட்டம் பெற்றார்.'

மாதிரி 1: டகோட்ரான் 2

மாதிரி 2: உண்மையான மனித

'ஜார்ஜ் வாஷிங்டன் அமெரிக்காவின் முதல் ஜனாதிபதியாக இருந்தார்.'

மாதிரி 1: டகோட்ரான் 2

மாதிரி 2: உண்மையான மனித

தாவி கெவின்சன் எவ்வளவு உயரம்

'நான் ரொமான்ஸில் மிகவும் பிஸியாக இருக்கிறேன்.'

மாதிரி 1: உண்மையான மனித

மாதிரி 2: டகோட்ரான் 2

எத்தனை நீங்கள் சரியாக வந்தீர்கள்? நீங்கள் உண்மையில் வித்தியாசத்தை சொல்ல முடியுமா, அல்லது நீங்கள் யூகிக்க வேண்டுமா?

சுவாரசியமான கட்டுரைகள்