ປັນຍາທຽມ ແລະ ຄວາມຢ້ານກົວຂອງການສູນຫາຍພາສາຊົນເຜົ່າສ່ວນນ້ອຍ

13:09 | 13/02/2024

ຍສໝ - ໃນປັດຈຸບັນ, ChatGPT ຢ່າງເປັນທາງການສະຫນັບສະຫນູນ 95 ພາສາຈາກ 7000 ພາສາທີ່ມີຢູ່ໃນໂລກ. ນັ້ນຫມາຍຄວາມວ່າເກືອບ 99% ຂອງພາສາຍັງບໍ່ທັນພົບເຫັນສຽງໃນສະພາບແວດລ້ອມປັນຍາປະດິດ.

ທ່ານເອກອັກຄະລັດຖະທູດ Iain Frew: ຫວຽດນາມ-ອັງກິດ ເພີ່ມທະວີການຮ່ວມມືສອງຝ່າຍ ທ່ານເອກອັກຄະລັດຖະທູດ Iain Frew: ຫວຽດນາມ-ອັງກິດ ເພີ່ມທະວີການຮ່ວມມືສອງຝ່າຍ
ວິສາຫະກິດ ຫວຽດນາມ ຍູ້ແຮງເລື່ອງສຳພັດກັບພູມປັນຍາທຽມ ວິສາຫະກິດ ຫວຽດນາມ ຍູ້ແຮງເລື່ອງສຳພັດກັບພູມປັນຍາທຽມ

ອີງຕາມຫນ້າທໍາອິດຂອງ OpenAI, ເຈົ້າຂອງ ChatGPT, ໃນແຕ່ລະເດືອນເຖິງ 180 ລ້ານຄົນທົ່ວໂລກກໍາລັງໃຊ້ ChatGPT. ທຸກໆມື້, ຫລາຍພັນລ້ານການສົນທະນາຂອງມະນຸດກັບເຄື່ອງຈັກກໍາລັງຖືກສ້າງຂື້ນ. ​ແຕ່​ໃນ​ການ​ສົນທະນາ​ນັບ​ພັນ​ລ້ານ​ເທື່ອ​ນັ້ນ, ພວກ​ເຮົາ​ເຫັນ​ວ່າ​ບໍ່​ມີ​ພາສາ​ສ່ວນ​ໜ້ອຍ. ແຕ່ລະພາສາແມ່ນຄວາມພາກພູມໃຈຂອງປະເທດຊາດ. ບໍ່​ພຽງ​ແຕ່​ແມ່ນ​ເຄື່ອງ​ໝາຍ​ສື່​ສານ​ເທົ່າ​ນັ້ນ, ຫາກ​ຍັງ​ແມ່ນ​ຊັບ​ສິນ​ທາງ​ດ້ານ​ວັດ​ທະ​ນະ​ທຳ, ປະ​ກອບ​ດ້ວຍ​ພູມ​ປັນ​ຍາ, ຄວາມ​ຮູ້ ແລະ ຄວາມ​ຮູ້​ສຶກ​ທີ່​ເປັນ​ເອ​ກະ​ລັກ​ສະ​ເພາະ​ຂອງ​ແຕ່​ລະ​ຊຸມ​ຊົນ. ແຕ່, ໃນເກມຂອງປັນຍາປະດິດສ້າງ, ພາສາຈໍານວນຫຼາຍມີຄວາມສ່ຽງຕໍ່ການຖືກລືມ. ເຄື່ອງຈັກຮຽນຮູ້ທີ່ຈະ "ເວົ້າ" ແລະ "ຟັງ" ຜ່ານພາສາທົ່ວໄປ. ໃນ​ຂະ​ນະ​ນັ້ນ, ສຽງ​ຂອງ​ຊຸມ​ຊົນ​ຂະ​ຫນາດ​ນ້ອຍ​ທີ່​ມີ​ພາ​ສາ​ເປັນ​ເອ​ກະ​ລັກ​ໄດ້​ງຽບ​ແລະ​ອາດ​ຈະ​ຕາຍ.

ປັນຍາທຽມ ແລະ ຄວາມຢ້ານກົວຂອງການສູນຫາຍພາສາຊົນເຜົ່າສ່ວນນ້ອຍ

ຮູບແບບພາສາຂະຫນາດໃຫຍ່ (LLM)

ໃນບັນດາຫຼາຍສາຂາຂອງການຄົ້ນຄວ້າປັນຍາປະດິດ, ມີສາຂາທີ່ເອີ້ນວ່າ AI generative, ແລະໃນບັນດາຫຼາຍສາຂາຂອງ AI generative, ມີສາຂາທີ່ມີຄວາມສົນໃຈຢ່າງຫຼວງຫຼາຍຕໍ່ຕະຫຼາດ, ເຊິ່ງແມ່ນຕົວແບບພາສາຂະຫນາດໃຫຍ່ (Large language model - LLM). ເພື່ອອະທິບາຍສັ້ນໆ, ແຕ່ລະຮູບແບບພາສາຂະຫນາດໃຫຍ່ແມ່ນເຄື່ອງຈັກທີ່ສ້າງຂຶ້ນເພື່ອຄາດເດົາຄໍາຕໍ່ໄປ. ມັນຄ້າຍຄືກັບການຫຼິ້ນເກມສະແດງ The Magic Hat. MC ຈະໃຫ້ riddle ແລະຈໍານວນຂອງຕົວອັກສອນໃນຄໍາຕອບ, ວຽກເຮັດງານທໍາຂອງທ່ານແມ່ນການຄາດເດົາວ່າຄໍາຕອບແມ່ນຫຍັງ.

ເຄື່ອງຈັກແມ່ນດີຫຼາຍໃນເກມພາສານີ້. ພວກເຂົາຈະໃຊ້ຄວາມເປັນໄປໄດ້ທາງສະຖິຕິລວມກັບບໍລິບົດເພື່ອເດົາວ່າຕົວອັກສອນໃດຈະກົງກັບຄຳຕອບທີ່ສຸດ. ໃນລະດັບກ້າວຫນ້າ, ປະໂຫຍກ, ວັກ, ແລະແນວຄວາມຄິດທີ່ເຫມາະສົມທີ່ສຸດທີ່ຈະຕອບຄໍາຖາມ. ຄືກັນກັບມະນຸດ, ເຄື່ອງຈັກເຫຼົ່ານີ້ຈະຕ້ອງໃຊ້ຄຳສັບ ແລະຄວາມຮູ້ເພື່ອສາມາດຕອບຄຳຖາມໄດ້. ໃນວິທະຍາສາດຄອມພິວເຕີ, ປະຊາຊົນເອີ້ນວ່າຂໍ້ມູນ.

ອີງຕາມການ BBC Science Focus, ເຄື່ອງ GPT3 ໄດ້ຮັບການຝຶກອົບຮົມໃນ 570 Gb ຂອງຂໍ້ມູນຂໍ້ຄວາມທີ່ຖືກກັ່ນຕອງ. ເອກະສານນີ້ມີປະມານ 300 ຕື້ຄໍາ, ເທົ່າກັບປະມານ 850 ລ້ານຫນ້າຂອງຂໍ້ຄວາມທີ່ພິມຢູ່ໃນເຈ້ຍ A4, ຂະຫນາດຕົວອັກສອນ Arial 12pt.

ຕົວເລກແມ່ນມີຄວາມປະທັບໃຈຫຼາຍ, ແຕ່ແຫຼ່ງຂໍ້ມູນນີ້ຍັງເປັນພຽງແຕ່ສ່ວນນ້ອຍໆຂອງຄັງຂໍ້ມູນຂອງມະນຸດເທົ່ານັ້ນ. ຄຸນນະພາບຂອງຄັງຂໍ້ມູນນີ້ບໍ່ສາມາດປຽບທຽບກັບຫ້ອງສະຫມຸດທີ່ສໍາຄັນໃນໂລກ, ມັນຍັງສາມາດເວົ້າໄດ້ວ່າຍັງມີສິ່ງອື່ນໆທີ່ນັບບໍ່ຖ້ວນປະປົນຢູ່ພາຍໃນ. ມັນເປັນມູນຄ່າບອກວ່າຫຼາຍກ່ວາ 9/10 ຂອງຖານຂໍ້ມູນນີ້ແມ່ນມາຈາກເອກະສານພາສາອັງກິດ. ພາສາອື່ນໆເຊັ່ນ: ຝຣັ່ງ, ເຢຍລະມັນ, ແອສປາໂຍນແລະ Italian ປະກອບເປັນ pie ສ່ວນໃຫຍ່ທີ່ຍັງເຫຼືອ. ພາ​ສາ​ອື່ນ​ທັງ​ຫມົດ​ໃນ​ໂລກ​ຄອບ​ຄອງ​ຊອຍ​ເປັນ​ບາງ​ເປັນ​ໃບ​ເຂົ້າ​, ເອີ້ນ​ວ່າ​ data.

ອີງຕາມການ BBC Science Focus, ເຄື່ອງ GPT3 ໄດ້ຮັບການຝຶກອົບຮົມໃນ 570 Gb ຂອງຂໍ້ມູນຂໍ້ຄວາມທີ່ຖືກກັ່ນຕອງ. ເອກະສານນີ້ມີປະມານ 300 ຕື້ຄໍາ, ເທົ່າກັບປະມານ 850 ລ້ານຫນ້າຂອງຂໍ້ຄວາມທີ່ພິມຢູ່ໃນເຈ້ຍ A4, ຂະຫນາດຕົວອັກສອນ Arial 12pt.

ຕົວເລກແມ່ນມີຄວາມປະທັບໃຈຫຼາຍ, ແຕ່ແຫຼ່ງຂໍ້ມູນນີ້ຍັງເປັນພຽງແຕ່ສ່ວນນ້ອຍໆຂອງຄັງຂໍ້ມູນຂອງມະນຸດເທົ່ານັ້ນ. ຄຸນນະພາບຂອງຄັງຂໍ້ມູນນີ້ບໍ່ສາມາດປຽບທຽບກັບຫ້ອງສະຫມຸດທີ່ສໍາຄັນໃນໂລກ, ມັນຍັງສາມາດເວົ້າໄດ້ວ່າຍັງມີສິ່ງອື່ນໆທີ່ນັບບໍ່ຖ້ວນປະປົນຢູ່ພາຍໃນ. ມັນເປັນມູນຄ່າບອກວ່າຫຼາຍກ່ວາ 9/10 ຂອງຖານຂໍ້ມູນນີ້ແມ່ນມາຈາກເອກະສານພາສາອັງກິດ. ພາສາອື່ນໆເຊັ່ນ: ຝຣັ່ງ, ເຢຍລະມັນ, ແອສປາໂຍນແລະ Italian ປະກອບເປັນ pie ສ່ວນໃຫຍ່ທີ່ຍັງເຫຼືອ. ພາ​ສາ​ອື່ນ​ທັງ​ຫມົດ​ໃນ​ໂລກ​ຄອບ​ຄອງ​ຊອຍ​ເປັນ​ບາງ​ເປັນ​ໃບ​ເຂົ້າ​, ເອີ້ນ​ວ່າ​ໃຫ້​.

ປັນຍາທຽມ ແລະ ຄວາມຢ້ານກົວຂອງການສູນຫາຍພາສາຊົນເຜົ່າສ່ວນນ້ອຍ

ຟີດຕົ້ນຕໍສໍາລັບ ChatGPT

ນີ້ແມ່ນເຫັນໄດ້ຊັດເຈນໃນຄຸນນະພາບຂອງ ChatGPT. GPT ແບບ 3.5 ແລະ 4 ສາມາດຕອບພາສາອັງກິດໄດ້ຢ່າງຄ່ອງແຄ້ວ, ແຕ່ພົບຄວາມຜິດພາດທີ່ໂງ່ຫຼາຍເມື່ອໃຊ້ຄໍາສັບພາສາຫວຽດນາມ, ມັກຈະສ້າງຫຍໍ້ຫນ້າທີ່ມີຄໍາສັບແລະການສະແດງອອກທາງໄວຍາກອນສັບສົນ.

ໃນສັ້ນ, ຂໍ້ມູນທີ່ມີຄຸນນະພາບຫຼາຍມີ, ການຄາດເດົາທີ່ດີກວ່າຮູບແບບພາສາຂະຫນາດໃຫຍ່ຈະມີ. ແລະໃນທາງກັບກັນ, ຂໍ້ມູນຫນ້ອຍ, ຂໍ້ມູນດີຫນ້ອຍຈະສ້າງຕົວແບບພາສາທີ່ມີຄຸນນະພາບຕ່ໍາ. ດັ່ງທີ່ຄົນເຕັກໂນໂລຢີມັກເວົ້າວ່າ: ຖ້າວັດສະດຸປ້ອນແມ່ນຂີ້ເຫຍື້ອ, ຜົນຜະລິດກໍ່ເປັນຂີ້ເຫຍື້ອ.

ດັ່ງນັ້ນ, ເຖິງແມ່ນວ່າມີເຕັກໂນໂລຢີທີ່ກ້າວຫນ້າທາງດ້ານຫລັງ, ຮູບແບບພາສາທີ່ສໍາຄັນຍັງບໍ່ສາມາດສໍາຜັດກັບຄວາມອຸດົມສົມບູນຂອງພາສາແລະວັດທະນະທໍາຂອງມະນຸດ.

ພາສາ ຍັງ "ຫັນໃຈປາ".

ອີງຕາມໂຄງການ ທົດສະວັດສາກົນຂອງພາສາພື້ນເມືອງຂອງ Unesco, ມີປະມານ 7,000 ພາສາທີ່ໃຊ້ຢູ່ໃນໂລກ. ແຕ່ທຸກໆສອງອາທິດ, ມະນຸດຈະສູນເສຍພາສາ. ນັ້ນແມ່ນ, ຄົນສຸດທ້າຍທີ່ເປັນເຈົ້າຂອງພາສານັ້ນໄດ້ເສຍຊີວິດຫຼືສູນເສຍຄວາມສາມາດໃນການສື່ສານ. ຕາມ​ການ​ຄາດ​ຄະ​ເນ, ໃນ​ທ້າຍ​ສັດ​ຕະ​ວັດ​ທີ 21, ພວກ​ເຮົາ​ຈະ​ເປັນ​ພະ​ຍານ​ເຖິງ​ການ​ຫາຍ​ສາບ​ສູນ​ໄປ​ໃນ​ປະ​ມານ 3,000 ພາ​ສາ.

ພາສາ​ທີ່​ຍັງ​ມີ​ຊີວິດ​ຢູ່​ສ່ວນ​ຫຼາຍ​ແມ່ນ​ຂອງ​ຊາວ​ເຜົ່າ​ມົ້ງ. ເພື່ອ​ໄດ້​ຮັບ​ກາ​ລະ​ໂອ​ກາດ​ການ​ພັດ​ທະ​ນາ, ຫຼາຍ​ຊຸມ​ຊົນ​ຕ້ອງ​ຄ່ອຍໆ​ປະ​ຖິ້ມ​ພາ​ສາ​ພື້ນ​ເມືອງ​ຂອງ​ຕົນ​ເພື່ອ​ປະ​ສົມ​ກັບ​ພາ​ສາ​ອື່ນໆ. ພາສາ​ທົ່ວ​ໄປ​ຂອງ​ຄົນ​ຮັ່ງມີ​ໄດ້​ຖື​ບົດບາດ​ອັນ​ພົ້ນ​ເດັ່ນ​ໃນ​ດ້ານ​ເສດຖະກິດ, ການ​ເມືອງ, ການ​ສຶກສາ ​ແລະ ​ເຕັກ​ໂນ​ໂລ​ຊີ.

ຖ້າທ່ານເປັນຄົນພື້ນເມືອງທີ່ເວົ້າພາສາ Naati ໃນເກາະໃນປາຊີຟິກໃຕ້, ທ່ານຈະເວົ້າພາສາຈີນຕະຫຼອດມື້ກັບນັກທ່ອງທ່ຽວ, ອ່ານຫນັງສືພິມພາສາອັງກິດ, ຕື່ມເອກະສານການແຕ່ງງານເປັນພາສາຝຣັ່ງ, ປະຊຸມກັບເພື່ອນຮ່ວມງານໃນ Bilasma. ເຈົ້າເວົ້ານາທີຕອນໃດ? ບາງທີໃນຄວາມຝັນ. ເພາະເຈົ້າເປັນຄົນສຸດທ້າຍທີ່ຍັງເວົ້ານາທີຢ່າງຄ່ອງແຄ້ວ.

ໃນກໍລະນີທີ່ຮ້າຍແຮງກວ່ານັ້ນ, ຄືກັບຊາວອາເມຣິກັນພື້ນເມືອງໃນທ້າຍສະຕະວັດທີ 19, ລັດຖະບານເຈົ້າພາບໄດ້ໃຊ້ຄວາມຮຸນແຮງເພື່ອບັງຄັບໃຫ້ປະຊາຊົນເຊົາພາສາຂອງເຂົາເຈົ້າ.

ປະຊາຊົນຜູ້ທີ່ສູນເສຍພາສາຂອງເຂົາເຈົ້າຈະສູນເສຍໂອກາດທີ່ຈະຮຽນຮູ້ຈາກບັນພະບຸລຸດຂອງເຂົາເຈົ້າ. ພວກເຂົາລອຍຢູ່ໃນສະພາບທາງຈິດໃຈທີ່ຂາດຕົວຕົນແລະຕົ້ນກໍາເນີດ. ເມື່ອພວກເຂົາບໍ່ຮັບຮູ້ວ່າພວກເຂົາແມ່ນໃຜ, ພວກເຂົາບໍ່ສາມາດເຊື່ອມຕໍ່ກັບຊຸມຊົນຂອງພວກເຂົາ. ຢູ່​ຄົນ​ດຽວ​ໃນ​ໂລກ​ທີ່​ມີ​ຄວາມ​ວຸ້ນວາຍ, ຄົນ​ເຫຼົ່າ​ນີ້​ຈະ​ປະສົບ​ກັບ​ຄວາມ​ຮູ້ສຶກ​ສິ້ນ​ຫວັງ, ຄວາມ​ໂສກ​ເສົ້າ, ການ​ສູນ​ເສຍ​ແລະ​ຄວາມ​ສ່ຽງ​ທີ່​ຈະ​ສູນ​ເສຍ​ຮາກ.

ດ້ວຍ​ແຕ່​ລະ​ພາ​ສາ​ໄດ້​ສູນ​ເສຍ​ໄປ, ຄວາມ​ຫຼາກ​ຫຼາຍ​ທາງ​ດ້ານ​ວັດ​ທະ​ນະ​ທຳ, ປັນ​ຍາ​ແລະ​ການ​ປະ​ດິດ​ສ້າງ​ຂອງ​ມະ​ນຸດ​ຈະ​ຂາດ​ຫາຍ​ໄປ. ຖ້າບໍ່ມີພາສາ, ທັດສະນະຂອງມະນຸດຈະມີຄວາມແປກປະຫຼາດກວ່າ. ຖ້າບໍ່ມີຫຼາຍພາສາ, ທັດສະນະຂອງມະນຸດຈະກາຍເປັນອະຄະຕິແລະບິດເບືອນ. ສອງສາມເສັ້ນຂອງຄວາມຄິດທີ່ເປັນທີ່ນິຍົມໃນພາສາທີ່ເຂັ້ມແຂງຈະຊະນະໂດຍບໍ່ມີການປະເຊີນກັບການວິພາກວິຈານທີ່ຖືກຕ້ອງແລະຈໍາເປັນ.

ຂໍ້ມູນທີ່ເຄີຍເປັນທີ່ນິຍົມໃນພາສາເຫຼົ່ານີ້ຈະກາຍເປັນທີ່ນິຍົມຫລາຍຂຶ້ນ. ໃນຂະນະທີ່ຂໍ້ມູນອື່ນໆ, ສະແດງອອກໃນພາສາທົ່ວໄປຫນ້ອຍ, ຈະຄ່ອຍໆຫາຍໄປ, ເຖິງແມ່ນວ່າພວກມັນຍັງມີຄຸນຄ່າຫຼາຍ.

AI: ການຂະຫຍາຍເຫຼົ່ານີ້ ອະຄະຕິ

ໃນປີ 2017, ການສືບສວນພາຍໃນຂອງວາລະສານທີ່ມີຊື່ສຽງແຫ່ງຊາດ National Geographic ສະແດງໃຫ້ເຫັນວ່າກ່ອນປີ 1970, ການລາຍງານຂອງພວກເຂົາເຕັມໄປດ້ວຍການຈໍາແນກຕໍ່ຄົນທີ່ມີສີສັນ. ເກີດໃນລະຫວ່າງຄວາມສູງຂອງອານານິຄົມ, ວາລະສານສະບັບນີ້ໄດ້ຮັບອິດທິພົນຢ່າງຫຼວງຫຼາຍໂດຍອຸດົມການເຊື້ອຊາດ.

ຄົນທີ່ມີສີສັນສະແດງໃຫ້ເຫັນສະເຫມີໃນເຄື່ອງນຸ່ງຫົ່ມ skimpy, ໂດຍສະເພາະແມ່ນແມ່ຍິງ. ພວກມັນຖືກສະແດງຈາກທັດສະນະທີ່ແປກປະຫຼາດ, ທຳມະຊາດ, ດ້ານຫຼັງ ແລະ ມັກຈະມີຄວາມຕື່ນເຕັ້ນ ແລະ ຖືກຄອບງຳໂດຍເຄື່ອງຈັກຕາເວັນຕົກທີ່ທັນສະໄໝ.

ຄຳຮຸ່ງ

ເຫດການ