ທ່ານເອກອັກຄະລັດຖະທູດ Iain Frew: ຫວຽດນາມ-ອັງກິດ ເພີ່ມທະວີການຮ່ວມມືສອງຝ່າຍ | |
ວິສາຫະກິດ ຫວຽດນາມ ຍູ້ແຮງເລື່ອງສຳພັດກັບພູມປັນຍາທຽມ |
ອີງຕາມຫນ້າທໍາອິດຂອງ OpenAI, ເຈົ້າຂອງ ChatGPT, ໃນແຕ່ລະເດືອນເຖິງ 180 ລ້ານຄົນທົ່ວໂລກກໍາລັງໃຊ້ ChatGPT. ທຸກໆມື້, ຫລາຍພັນລ້ານການສົນທະນາຂອງມະນຸດກັບເຄື່ອງຈັກກໍາລັງຖືກສ້າງຂື້ນ. ແຕ່ໃນການສົນທະນານັບພັນລ້ານເທື່ອນັ້ນ, ພວກເຮົາເຫັນວ່າບໍ່ມີພາສາສ່ວນໜ້ອຍ. ແຕ່ລະພາສາແມ່ນຄວາມພາກພູມໃຈຂອງປະເທດຊາດ. ບໍ່ພຽງແຕ່ແມ່ນເຄື່ອງໝາຍສື່ສານເທົ່ານັ້ນ, ຫາກຍັງແມ່ນຊັບສິນທາງດ້ານວັດທະນະທຳ, ປະກອບດ້ວຍພູມປັນຍາ, ຄວາມຮູ້ ແລະ ຄວາມຮູ້ສຶກທີ່ເປັນເອກະລັກສະເພາະຂອງແຕ່ລະຊຸມຊົນ. ແຕ່, ໃນເກມຂອງປັນຍາປະດິດສ້າງ, ພາສາຈໍານວນຫຼາຍມີຄວາມສ່ຽງຕໍ່ການຖືກລືມ. ເຄື່ອງຈັກຮຽນຮູ້ທີ່ຈະ "ເວົ້າ" ແລະ "ຟັງ" ຜ່ານພາສາທົ່ວໄປ. ໃນຂະນະນັ້ນ, ສຽງຂອງຊຸມຊົນຂະຫນາດນ້ອຍທີ່ມີພາສາເປັນເອກະລັກໄດ້ງຽບແລະອາດຈະຕາຍ.
ຮູບແບບພາສາຂະຫນາດໃຫຍ່ (LLM)
ໃນບັນດາຫຼາຍສາຂາຂອງການຄົ້ນຄວ້າປັນຍາປະດິດ, ມີສາຂາທີ່ເອີ້ນວ່າ AI generative, ແລະໃນບັນດາຫຼາຍສາຂາຂອງ AI generative, ມີສາຂາທີ່ມີຄວາມສົນໃຈຢ່າງຫຼວງຫຼາຍຕໍ່ຕະຫຼາດ, ເຊິ່ງແມ່ນຕົວແບບພາສາຂະຫນາດໃຫຍ່ (Large language model - LLM). ເພື່ອອະທິບາຍສັ້ນໆ, ແຕ່ລະຮູບແບບພາສາຂະຫນາດໃຫຍ່ແມ່ນເຄື່ອງຈັກທີ່ສ້າງຂຶ້ນເພື່ອຄາດເດົາຄໍາຕໍ່ໄປ. ມັນຄ້າຍຄືກັບການຫຼິ້ນເກມສະແດງ The Magic Hat. MC ຈະໃຫ້ riddle ແລະຈໍານວນຂອງຕົວອັກສອນໃນຄໍາຕອບ, ວຽກເຮັດງານທໍາຂອງທ່ານແມ່ນການຄາດເດົາວ່າຄໍາຕອບແມ່ນຫຍັງ.
ເຄື່ອງຈັກແມ່ນດີຫຼາຍໃນເກມພາສານີ້. ພວກເຂົາຈະໃຊ້ຄວາມເປັນໄປໄດ້ທາງສະຖິຕິລວມກັບບໍລິບົດເພື່ອເດົາວ່າຕົວອັກສອນໃດຈະກົງກັບຄຳຕອບທີ່ສຸດ. ໃນລະດັບກ້າວຫນ້າ, ປະໂຫຍກ, ວັກ, ແລະແນວຄວາມຄິດທີ່ເຫມາະສົມທີ່ສຸດທີ່ຈະຕອບຄໍາຖາມ. ຄືກັນກັບມະນຸດ, ເຄື່ອງຈັກເຫຼົ່ານີ້ຈະຕ້ອງໃຊ້ຄຳສັບ ແລະຄວາມຮູ້ເພື່ອສາມາດຕອບຄຳຖາມໄດ້. ໃນວິທະຍາສາດຄອມພິວເຕີ, ປະຊາຊົນເອີ້ນວ່າຂໍ້ມູນ.
ອີງຕາມການ BBC Science Focus, ເຄື່ອງ GPT3 ໄດ້ຮັບການຝຶກອົບຮົມໃນ 570 Gb ຂອງຂໍ້ມູນຂໍ້ຄວາມທີ່ຖືກກັ່ນຕອງ. ເອກະສານນີ້ມີປະມານ 300 ຕື້ຄໍາ, ເທົ່າກັບປະມານ 850 ລ້ານຫນ້າຂອງຂໍ້ຄວາມທີ່ພິມຢູ່ໃນເຈ້ຍ A4, ຂະຫນາດຕົວອັກສອນ Arial 12pt.
ຕົວເລກແມ່ນມີຄວາມປະທັບໃຈຫຼາຍ, ແຕ່ແຫຼ່ງຂໍ້ມູນນີ້ຍັງເປັນພຽງແຕ່ສ່ວນນ້ອຍໆຂອງຄັງຂໍ້ມູນຂອງມະນຸດເທົ່ານັ້ນ. ຄຸນນະພາບຂອງຄັງຂໍ້ມູນນີ້ບໍ່ສາມາດປຽບທຽບກັບຫ້ອງສະຫມຸດທີ່ສໍາຄັນໃນໂລກ, ມັນຍັງສາມາດເວົ້າໄດ້ວ່າຍັງມີສິ່ງອື່ນໆທີ່ນັບບໍ່ຖ້ວນປະປົນຢູ່ພາຍໃນ. ມັນເປັນມູນຄ່າບອກວ່າຫຼາຍກ່ວາ 9/10 ຂອງຖານຂໍ້ມູນນີ້ແມ່ນມາຈາກເອກະສານພາສາອັງກິດ. ພາສາອື່ນໆເຊັ່ນ: ຝຣັ່ງ, ເຢຍລະມັນ, ແອສປາໂຍນແລະ Italian ປະກອບເປັນ pie ສ່ວນໃຫຍ່ທີ່ຍັງເຫຼືອ. ພາສາອື່ນທັງຫມົດໃນໂລກຄອບຄອງຊອຍເປັນບາງເປັນໃບເຂົ້າ, ເອີ້ນວ່າ data.
ອີງຕາມການ BBC Science Focus, ເຄື່ອງ GPT3 ໄດ້ຮັບການຝຶກອົບຮົມໃນ 570 Gb ຂອງຂໍ້ມູນຂໍ້ຄວາມທີ່ຖືກກັ່ນຕອງ. ເອກະສານນີ້ມີປະມານ 300 ຕື້ຄໍາ, ເທົ່າກັບປະມານ 850 ລ້ານຫນ້າຂອງຂໍ້ຄວາມທີ່ພິມຢູ່ໃນເຈ້ຍ A4, ຂະຫນາດຕົວອັກສອນ Arial 12pt.
ຕົວເລກແມ່ນມີຄວາມປະທັບໃຈຫຼາຍ, ແຕ່ແຫຼ່ງຂໍ້ມູນນີ້ຍັງເປັນພຽງແຕ່ສ່ວນນ້ອຍໆຂອງຄັງຂໍ້ມູນຂອງມະນຸດເທົ່ານັ້ນ. ຄຸນນະພາບຂອງຄັງຂໍ້ມູນນີ້ບໍ່ສາມາດປຽບທຽບກັບຫ້ອງສະຫມຸດທີ່ສໍາຄັນໃນໂລກ, ມັນຍັງສາມາດເວົ້າໄດ້ວ່າຍັງມີສິ່ງອື່ນໆທີ່ນັບບໍ່ຖ້ວນປະປົນຢູ່ພາຍໃນ. ມັນເປັນມູນຄ່າບອກວ່າຫຼາຍກ່ວາ 9/10 ຂອງຖານຂໍ້ມູນນີ້ແມ່ນມາຈາກເອກະສານພາສາອັງກິດ. ພາສາອື່ນໆເຊັ່ນ: ຝຣັ່ງ, ເຢຍລະມັນ, ແອສປາໂຍນແລະ Italian ປະກອບເປັນ pie ສ່ວນໃຫຍ່ທີ່ຍັງເຫຼືອ. ພາສາອື່ນທັງຫມົດໃນໂລກຄອບຄອງຊອຍເປັນບາງເປັນໃບເຂົ້າ, ເອີ້ນວ່າໃຫ້.
ຟີດຕົ້ນຕໍສໍາລັບ ChatGPT
ນີ້ແມ່ນເຫັນໄດ້ຊັດເຈນໃນຄຸນນະພາບຂອງ ChatGPT. GPT ແບບ 3.5 ແລະ 4 ສາມາດຕອບພາສາອັງກິດໄດ້ຢ່າງຄ່ອງແຄ້ວ, ແຕ່ພົບຄວາມຜິດພາດທີ່ໂງ່ຫຼາຍເມື່ອໃຊ້ຄໍາສັບພາສາຫວຽດນາມ, ມັກຈະສ້າງຫຍໍ້ຫນ້າທີ່ມີຄໍາສັບແລະການສະແດງອອກທາງໄວຍາກອນສັບສົນ.
ໃນສັ້ນ, ຂໍ້ມູນທີ່ມີຄຸນນະພາບຫຼາຍມີ, ການຄາດເດົາທີ່ດີກວ່າຮູບແບບພາສາຂະຫນາດໃຫຍ່ຈະມີ. ແລະໃນທາງກັບກັນ, ຂໍ້ມູນຫນ້ອຍ, ຂໍ້ມູນດີຫນ້ອຍຈະສ້າງຕົວແບບພາສາທີ່ມີຄຸນນະພາບຕ່ໍາ. ດັ່ງທີ່ຄົນເຕັກໂນໂລຢີມັກເວົ້າວ່າ: ຖ້າວັດສະດຸປ້ອນແມ່ນຂີ້ເຫຍື້ອ, ຜົນຜະລິດກໍ່ເປັນຂີ້ເຫຍື້ອ.
ດັ່ງນັ້ນ, ເຖິງແມ່ນວ່າມີເຕັກໂນໂລຢີທີ່ກ້າວຫນ້າທາງດ້ານຫລັງ, ຮູບແບບພາສາທີ່ສໍາຄັນຍັງບໍ່ສາມາດສໍາຜັດກັບຄວາມອຸດົມສົມບູນຂອງພາສາແລະວັດທະນະທໍາຂອງມະນຸດ.
ພາສາ ຍັງ "ຫັນໃຈປາ".
ອີງຕາມໂຄງການ ທົດສະວັດສາກົນຂອງພາສາພື້ນເມືອງຂອງ Unesco, ມີປະມານ 7,000 ພາສາທີ່ໃຊ້ຢູ່ໃນໂລກ. ແຕ່ທຸກໆສອງອາທິດ, ມະນຸດຈະສູນເສຍພາສາ. ນັ້ນແມ່ນ, ຄົນສຸດທ້າຍທີ່ເປັນເຈົ້າຂອງພາສານັ້ນໄດ້ເສຍຊີວິດຫຼືສູນເສຍຄວາມສາມາດໃນການສື່ສານ. ຕາມການຄາດຄະເນ, ໃນທ້າຍສັດຕະວັດທີ 21, ພວກເຮົາຈະເປັນພະຍານເຖິງການຫາຍສາບສູນໄປໃນປະມານ 3,000 ພາສາ.
ພາສາທີ່ຍັງມີຊີວິດຢູ່ສ່ວນຫຼາຍແມ່ນຂອງຊາວເຜົ່າມົ້ງ. ເພື່ອໄດ້ຮັບກາລະໂອກາດການພັດທະນາ, ຫຼາຍຊຸມຊົນຕ້ອງຄ່ອຍໆປະຖິ້ມພາສາພື້ນເມືອງຂອງຕົນເພື່ອປະສົມກັບພາສາອື່ນໆ. ພາສາທົ່ວໄປຂອງຄົນຮັ່ງມີໄດ້ຖືບົດບາດອັນພົ້ນເດັ່ນໃນດ້ານເສດຖະກິດ, ການເມືອງ, ການສຶກສາ ແລະ ເຕັກໂນໂລຊີ.
ຖ້າທ່ານເປັນຄົນພື້ນເມືອງທີ່ເວົ້າພາສາ Naati ໃນເກາະໃນປາຊີຟິກໃຕ້, ທ່ານຈະເວົ້າພາສາຈີນຕະຫຼອດມື້ກັບນັກທ່ອງທ່ຽວ, ອ່ານຫນັງສືພິມພາສາອັງກິດ, ຕື່ມເອກະສານການແຕ່ງງານເປັນພາສາຝຣັ່ງ, ປະຊຸມກັບເພື່ອນຮ່ວມງານໃນ Bilasma. ເຈົ້າເວົ້ານາທີຕອນໃດ? ບາງທີໃນຄວາມຝັນ. ເພາະເຈົ້າເປັນຄົນສຸດທ້າຍທີ່ຍັງເວົ້ານາທີຢ່າງຄ່ອງແຄ້ວ.
ໃນກໍລະນີທີ່ຮ້າຍແຮງກວ່ານັ້ນ, ຄືກັບຊາວອາເມຣິກັນພື້ນເມືອງໃນທ້າຍສະຕະວັດທີ 19, ລັດຖະບານເຈົ້າພາບໄດ້ໃຊ້ຄວາມຮຸນແຮງເພື່ອບັງຄັບໃຫ້ປະຊາຊົນເຊົາພາສາຂອງເຂົາເຈົ້າ.
ປະຊາຊົນຜູ້ທີ່ສູນເສຍພາສາຂອງເຂົາເຈົ້າຈະສູນເສຍໂອກາດທີ່ຈະຮຽນຮູ້ຈາກບັນພະບຸລຸດຂອງເຂົາເຈົ້າ. ພວກເຂົາລອຍຢູ່ໃນສະພາບທາງຈິດໃຈທີ່ຂາດຕົວຕົນແລະຕົ້ນກໍາເນີດ. ເມື່ອພວກເຂົາບໍ່ຮັບຮູ້ວ່າພວກເຂົາແມ່ນໃຜ, ພວກເຂົາບໍ່ສາມາດເຊື່ອມຕໍ່ກັບຊຸມຊົນຂອງພວກເຂົາ. ຢູ່ຄົນດຽວໃນໂລກທີ່ມີຄວາມວຸ້ນວາຍ, ຄົນເຫຼົ່ານີ້ຈະປະສົບກັບຄວາມຮູ້ສຶກສິ້ນຫວັງ, ຄວາມໂສກເສົ້າ, ການສູນເສຍແລະຄວາມສ່ຽງທີ່ຈະສູນເສຍຮາກ.
ດ້ວຍແຕ່ລະພາສາໄດ້ສູນເສຍໄປ, ຄວາມຫຼາກຫຼາຍທາງດ້ານວັດທະນະທຳ, ປັນຍາແລະການປະດິດສ້າງຂອງມະນຸດຈະຂາດຫາຍໄປ. ຖ້າບໍ່ມີພາສາ, ທັດສະນະຂອງມະນຸດຈະມີຄວາມແປກປະຫຼາດກວ່າ. ຖ້າບໍ່ມີຫຼາຍພາສາ, ທັດສະນະຂອງມະນຸດຈະກາຍເປັນອະຄະຕິແລະບິດເບືອນ. ສອງສາມເສັ້ນຂອງຄວາມຄິດທີ່ເປັນທີ່ນິຍົມໃນພາສາທີ່ເຂັ້ມແຂງຈະຊະນະໂດຍບໍ່ມີການປະເຊີນກັບການວິພາກວິຈານທີ່ຖືກຕ້ອງແລະຈໍາເປັນ.
ຂໍ້ມູນທີ່ເຄີຍເປັນທີ່ນິຍົມໃນພາສາເຫຼົ່ານີ້ຈະກາຍເປັນທີ່ນິຍົມຫລາຍຂຶ້ນ. ໃນຂະນະທີ່ຂໍ້ມູນອື່ນໆ, ສະແດງອອກໃນພາສາທົ່ວໄປຫນ້ອຍ, ຈະຄ່ອຍໆຫາຍໄປ, ເຖິງແມ່ນວ່າພວກມັນຍັງມີຄຸນຄ່າຫຼາຍ.
AI: ການຂະຫຍາຍເຫຼົ່ານີ້ ອະຄະຕິ
ໃນປີ 2017, ການສືບສວນພາຍໃນຂອງວາລະສານທີ່ມີຊື່ສຽງແຫ່ງຊາດ National Geographic ສະແດງໃຫ້ເຫັນວ່າກ່ອນປີ 1970, ການລາຍງານຂອງພວກເຂົາເຕັມໄປດ້ວຍການຈໍາແນກຕໍ່ຄົນທີ່ມີສີສັນ. ເກີດໃນລະຫວ່າງຄວາມສູງຂອງອານານິຄົມ, ວາລະສານສະບັບນີ້ໄດ້ຮັບອິດທິພົນຢ່າງຫຼວງຫຼາຍໂດຍອຸດົມການເຊື້ອຊາດ.
ຄົນທີ່ມີສີສັນສະແດງໃຫ້ເຫັນສະເຫມີໃນເຄື່ອງນຸ່ງຫົ່ມ skimpy, ໂດຍສະເພາະແມ່ນແມ່ຍິງ. ພວກມັນຖືກສະແດງຈາກທັດສະນະທີ່ແປກປະຫຼາດ, ທຳມະຊາດ, ດ້ານຫຼັງ ແລະ ມັກຈະມີຄວາມຕື່ນເຕັ້ນ ແລະ ຖືກຄອບງຳໂດຍເຄື່ອງຈັກຕາເວັນຕົກທີ່ທັນສະໄໝ.
ຄຳຮຸ່ງ