Views: 0 Author: Site Editor ເວລາເຜີຍແຜ່: 2026-04-28 ຕົ້ນກໍາເນີດ: ເວັບໄຊ
ຈິນຕະນາການຢືນຢູ່ເທິງພື້ນໂຮງງານ: ເຄື່ອງຈັກ whir, conveyors hum, forklift beeps ໃນຂະນະທີ່ມັນ back up, ແລະຜູ້ໃດຜູ້ຫນຶ່ງໃນທົ່ວ aisle shouts ເປັນວິທະຍຸ. ຕອນນີ້ລອງບອກແວ່ນຕາ AI ຂອງທ່ານ, 'ຂັ້ນຕອນຕໍ່ໄປ.' Spoiler: ມັນບໍ່ຄ່ອຍງ່າຍປານໃດ.
ການຄວບຄຸມດ້ວຍສຽງຄວນເຮັດໃຫ້ມືບໍ່ເສຍຄ່າ—ແຕ່ໃນການຕັ້ງຖິ່ນຖານອຸດສາຫະກຳທີ່ແທ້ຈິງ, ມັນມັກຈະບໍ່ມີການຄວບຄຸມເລີຍ. ໄມໂຄຣໂຟນເກັບສຽງດັງຂອງເຄື່ອງຈັກທັງໝົດ ຍົກເວັ້ນສຽງດັງຂອງທ່ານ, ຫຼືເຮັດໃຫ້ສຽງບີບສັບສົນເພື່ອ 'ຢຸດ.' ຂ້ອຍໄດ້ໃຊ້ເວລາຢູ່ພື້ນໂຮງງານພຽງພໍເພື່ອຮູ້ວ່ານີ້ບໍ່ແມ່ນຄວາມລົບກວນເລັກນ້ອຍ; ມັນເປັນເຫດຜົນທີ່ຄົນງານຫຼາຍຄົນປະຖິ້ມຄໍາສັ່ງສຽງຫຼັງຈາກປ່ຽນຫນຶ່ງແລະກັບຄືນໄປຫາຫນ້າຈໍແຕະ.
ແຕ່ນີ້ແມ່ນຂ່າວດີ: ເຕັກໂນໂລຢີໄດ້ມາຢ່າງຍາວນານ. ມັນບໍ່ສົມບູນແບບ, ແຕ່ສຸດທ້າຍມັນມີຄວາມໜ້າເຊື່ອຖືພຽງພໍທີ່ຈະເຮັດວຽກທີ່ມັນສຳຄັນທີ່ສຸດ. ໃຫ້ພວກເຮົາທໍາລາຍສິ່ງທ້າທາຍທີ່ແທ້ຈິງ - ແລະວິທີທີ່ພວກເຮົາໄດ້ແກ້ໄຂມັນ.
ສິ່ງລົບກວນອຸດສາຫະກໍາບໍ່ພຽງແຕ່ດັງເທົ່ານັ້ນ - ມັນມີໂຄງສ້າງ. ເຄື່ອງມີສຽງດັງຢູ່ໃນຄວາມຖີ່ສະເພາະ, ເຄື່ອງອັດສຽງດັງ, ອັດສຽງດັງ. ສຽງເຫຼົ່ານີ້ດັງຂຶ້ນໃນສະເປກຣອມ, ເຮັດໃຫ້ຄຳເວົ້າຂອງມະນຸດຈົມນ້ຳຢ່າງງ່າຍດາຍ. ຜູ້ຊ່ວຍສຽງຂອງຜູ້ບໍລິໂພກ (ໃນໂທລະສັບ ຫຼື ລຳໂພງອັດສະລິຍະ) ບໍ່ໄດ້ສ້າງຂຶ້ນສຳລັບອັນນີ້; ພວກມັນຖືກທົດສອບຢູ່ໃນເຮືອນທີ່ງຽບໆ, ບໍ່ແມ່ນຢູ່ຂ້າງເຄື່ອງກົດ.
ຄວາມກ້າວຫນ້າ: ແວ່ນຕາ AI ອຸດສາຫະກໍາທີ່ທັນສະໄຫມໃຊ້ beamforming microphone arrays (ຫຼາຍ mics ເຮັດວຽກຮ່ວມກັນ) ແລະ ການສະກັດກັ້ນສຽງ neural - AI ທີ່ຮຽນຮູ້ທີ່ຈະບອກສຽງຂອງທ່ານນອກຈາກເຄື່ອງ racket. ແທນທີ່ຈະເຮັດໃຫ້ສິ່ງລົບກວນພື້ນຫຼັງຫຼຸດລົງ, ພວກເຂົາເຈົ້າບໍ່ເຂົ້າໄປໃນທິດທາງຂອງປາກຂອງທ່ານແລະກັ່ນຕອງອອກທຸກສິ່ງທຸກຢ່າງ.
ຜູ້ຜະລິດຫນຶ່ງທີ່ພວກເຮົາເຮັດວຽກກັບການທົດສອບຄວາມຖືກຕ້ອງຂອງສຽງໃນ ສະພາບແວດລ້ອມ 95 dB — ປະມານດັງເທົ່າກັບເຄື່ອງຕັດຫຍ້າຢູ່ຂ້າງຫູຂອງເຈົ້າ. ດ້ວຍການສະກັດກັ້ນສິ່ງລົບກວນທີ່ດີ, ຄວາມຖືກຕ້ອງຢູ່ເຫນືອ 92%; ໂດຍບໍ່ມີມັນ, ມັນຫຼຸດລົງຕໍ່າກວ່າ 40%.
ເຄີຍພະຍາຍາມລົມກັບໃຜຜູ້ຫນຶ່ງໃນຂະນະທີ່ຫັນຫນ້າອອກໄປບໍ? ສຽງຂອງທ່ານມີສຽງບໍ່ພໍໃຈ - ແລະເຊັ່ນດຽວກັນກັບໄມໂຄໂຟນ. ຢູ່ເທິງພື້ນເຮືອນທີ່ມີສຽງດັງ, ຄົນງານຫັນຫົວຢ່າງຕໍ່ເນື່ອງ: ກວດເບິ່ງເຄື່ອງຈັກ, ຈັບເຄື່ອງມື, ກວດກາສ່ວນຫນຶ່ງ. ຖ້າ mics ຂອງແວ່ນຕາເຮັດວຽກພຽງແຕ່ໃນເວລາທີ່ທ່ານກໍາລັງຫັນຫນ້າຊື່, ຄວາມຖືກຕ້ອງຫຼຸດລົງ ໃນວິນາທີທີ່ທ່ານເບິ່ງໄປ.
ຄວາມແຕກແຍກ: ແວ່ນຕາອຸດສາຫະກໍາໃໝ່ກວ່າໃຊ້ beamforming 360 ອົງສາ ທີ່ຕິດຕາມຕໍາແໜ່ງຫົວຂອງເຈົ້າ ແລະປັບຈຸດໂຟກັສຂອງໄມ. ບາງຄົນກໍ່ໃຊ້ ເຊັນເຊີການປະພຶດຂອງກະດູກ (ເຊັ່ນ: ຊຸດຫູຟັງທະຫານ) ທີ່ຮັບເອົາການສັ່ນສະເທືອນຈາກກະໂຫຼກຫົວຂອງທ່ານ—ບໍ່ສົນໃຈສິ່ງລົບກວນອ້ອມຂ້າງທັງໝົດ.
ພວກເຮົາໄດ້ທົດສອບຄູ່ກັບການເຊື່ອມຕໍ່ຂອງກະດູກຢູ່ໃນບ່ອນກໍ່ສ້າງ: ຄົນງານຄົນໜຶ່ງໄດ້ກະຊິບຄຳສັ່ງໃນຂະນະທີ່ຢືນຢູ່ຂ້າງເຄື່ອງກຳເນີດແລ່ນ, ແລະແວ່ນຍັງໄດ້ມັນ. ນັ້ນບໍ່ແມ່ນວິເສດ - ມັນເປັນພຽງແຕ່ຟີຊິກທີ່ສະຫຼາດ.
ບໍ່ມີສອງຄົນເວົ້າຄືກັນ. ສຳນຽງ, ພາສາ, ສຽງຈົ່ມ, ເວົ້າໄວ ຫຼື ຊ້າເກີນໄປ—ທີມງານອຸດສາຫະກຳແມ່ນມີຄວາມຫຼາກຫຼາຍຍິ່ງຂຶ້ນ: ພະນັກງານຂ້າມຊາດ, ຄົນງານທີ່ມາຈາກພາກພື້ນຕ່າງໆ, ຜູ້ຄົນຮ້ອງຂຶ້ນດ້ວຍສຽງດັງ. ຜູ້ຊ່ວຍຜູ້ບໍລິໂພກຮຽນຮູ້ຈາກຜູ້ໃຊ້ຫຼາຍລ້ານຄົນ; ແວ່ນຕາອຸດສາຫະກໍາບໍ່ມີຄວາມຫລູຫລາ - ທຸກໆໂຮງງານແມ່ນສະພາບແວດລ້ອມປິດຂອງຕົນເອງ.
ຄວາມກ້າວໜ້າ: ໃນອຸປະກອນ, ຮູບແບບພາສາທີ່ສາມາດປັບແຕ່ງໄດ້. ແທນທີ່ຈະສົ່ງສຽງຂອງທ່ານໄປຟັງ (ທີ່ຍົກທຸງສີແດງຄວາມເປັນສ່ວນຕົວ), ແວ່ນຕາທີ່ທັນສະໄຫມສາມາດໄດ້ຮັບ ການຝຶກອົບຮົມຢູ່ໃນເວັບໄຊໄດ້ . ປ້ອນລະບົບສອງສາມຊົ່ວໂມງຂອງຄຳເວົ້າຂອງທີມເຈົ້າ—ສຳນຽງທີ່ແຕກຕ່າງ, ຄຳສັ່ງທົ່ວໄປ—ແລະຄວາມຖືກຕ້ອງເພີ່ມຂຶ້ນຢ່າງຫຼວງຫຼາຍ.
ບໍລິສັດຂົນສົ່ງຫນຶ່ງໄດ້ບັນທຶກ 20 ນາທີຂອງພະນັກງານສາງຂອງພວກເຂົາໂດຍໃຊ້ຄໍາສັ່ງພື້ນຖານ ('ຕໍ່ໄປ,' 'ຢືນຢັນ,' 'ຢຸດ'). ຫຼັງຈາກການຝຶກອົບຮົມ, ອັດຕາຄວາມຜິດພາດຫຼຸດລົງ 60%.
ຂໍໃຫ້ເປັນຈິງ: ການຄວບຄຸມດ້ວຍສຽງຍັງບໍ່ພ້ອມສໍາລັບທຸກໆສະພາບແວດລ້ອມອຸດສາຫະກໍາ.
ມັນເຮັດວຽກໄດ້ດີເມື່ອ:
ສຽງດັງໃນພື້ນຫຼັງແມ່ນ ຕ່ຳກວ່າ 85 dB (ດັງ, ແຕ່ບໍ່ຫູໜວກ)
ຄຳສັ່ງ ສັ້ນ ແລະຈະແຈ້ງ ('ຂັ້ນຕອນຕໍ່ໄປ,' 'ສະແດງແຜນວາດ,' 'ໂທຫາຜູ້ຊ່ຽວຊານ')
ຄົນງານສາມາດຫັນໜ້າໄປທາງ mics ຂອງແວ່ນຕາໃນເວລາເວົ້າ
ທ່ານມີເວລາສໍາລັບ ກອງປະຊຸມການຝຶກອົບຮົມສຽງໄວ
ມັນຍັງມີການຕໍ່ສູ້ໃນເວລາທີ່:
ຫຼາຍຄົນເວົ້າຢູ່ໃກ້ໆ (ໄມບໍ່ສາມາດບອກແຍກເຂົາເຈົ້າໄດ້ສະເໝີ)
ພະນັກງານມີສຳນຽງ ຫຼືສຽງເວົ້າຢ່າງໜັກໜ່ວງໂດຍບໍ່ມີການຝຶກອົບຮົມແບບກຳນົດເອງ
ສຽງດັງຢູ່ໃນອາວະກາດ (ສາງໂລຫະໃຫຍ່ແມ່ນໂຫດຮ້າຍສໍາລັບສຽງ)
ທ່ານຕ້ອງການ dictation ຢ່າງຕໍ່ເນື່ອງ (ປະໂຫຍກເຕັມແມ່ນຍາກກວ່າຄໍາສັ່ງສັ້ນ)
upside? ສໍາລັບວຽກງານອຸດສາຫະກໍາສ່ວນໃຫຍ່ - ການຊີ້ນໍາການສ້ອມແປງ, ຢືນຢັນການເລືອກ, ບັນທຶກການກວດສອບ - ຄໍາສັ່ງສັ້ນແມ່ນທັງຫມົດທີ່ທ່ານຕ້ອງການ. ແລະສໍາລັບວຽກງານເຫຼົ່ານັ້ນ, ເຕັກໂນໂລຊີໃນມື້ນີ້ແມ່ນຫຼາຍກ່ວາທີ່ດີພຽງພໍ.
ຜູ້ປະກອບການສາງທີ່ພວກເຮົາເຮັດວຽກກັບແວ່ນຕາ AI ທີ່ຕິດຕັ້ງໃນເບື້ອງຕົ້ນທີ່ມີການຄວບຄຸມ gesture: ຄົນງານໄດ້ແຕະວັດເພື່ອຢືນຢັນການເລືອກເອົາແຕ່ລະຄົນ. ເຂົາເຈົ້າກຽດຊັງມັນ —ມືຂອງເຂົາເຈົ້າເຕັມໄປສະເໝີ ແລະການເອື້ອມຂຶ້ນເຮັດໃຫ້ເຂົາເຈົ້າຊ້າລົງ.
ພວກເຂົາປ່ຽນເປັນສຽງ: ເວົ້າວ່າ 'ແລ້ວໆ' ຫຼັງຈາກເລືອກແຕ່ລະຄັ້ງ. ຄວາມຖືກຕ້ອງແມ່ນດີຢູ່ໃນເຂດທີ່ງຽບສະຫງົບ, ແຕ່ຂີ້ຮ້າຍຢູ່ໃກ້ກັບບ່ອນຈອດລົດ, ບ່ອນທີ່ລົດບັນທຸກດັງດັງບໍ່ຢຸດ. ການແກ້ໄຂ? ໄມໂຄຣມິກແບບມີສຽງ ບວກກັບ ຊຸດຝຶກອົບຮົມສຽງ 10 ນາທີ ຕໍ່ຄົນງານ. ຫຼັງຈາກນັ້ນ, ຄວາມຖືກຕ້ອງເພີ່ມຂຶ້ນຈາກ 72% ເປັນ 94% ຢູ່ໃກ້ກັບທ່າເຮືອ. ຄົນງານຢຸດຈົ່ມ; ຜູ້ເລືອກເອົາຄົນໜຶ່ງບອກພວກເຮົາວ່າ, 'ດຽວນີ້ຂ້ອຍເວົ້າມັນ ແລະສືບຕໍ່ໄປ - ຂ້ອຍບໍ່ໄດ້ຄິດກ່ຽວກັບມັນອີກຕໍ່ໄປ.'
ນັ້ນແມ່ນເປົ້າຫມາຍ: ສຽງຄວນປະສົມປະສານເຂົ້າໃນຂະບວນການເຮັດວຽກ. ທ່ານບໍ່ຄວນຄິດກ່ຽວກັບເຕັກໂນໂລຢີ - ພຽງແຕ່ເວົ້າສິ່ງທີ່ທ່ານຕ້ອງການ, ແລະມັນກໍ່ເກີດຂື້ນ.
ຖ້າການຄວບຄຸມສຽງສໍາຄັນສໍາລັບທີມງານຂອງທ່ານ (ແລະຢູ່ໃນພື້ນທີ່ບໍ່ມີສຽງ, ມັນອາດຈະເປັນ), ນີ້ແມ່ນສິ່ງທີ່ຕ້ອງກວດເບິ່ງ:
ຈຳນວນໄມໂຄຣໂຟນ: ຕັ້ງເປົ້າໝາຍໄວ້ 3 ຫຼືຫຼາຍກວ່ານັ້ນ. ລະບົບໄມດຽວຈະບໍ່ຕັດມັນ.
ການສະກັດກັ້ນສຽງລົບກວນ: ຊອກຫາການກັ່ນຕອງທາງປະສາດໂດຍອີງໃສ່ AI, ບໍ່ພຽງແຕ່ການຍົກເລີກສຽງສະທ້ອນພື້ນຖານ.
Beamforming: ມັນສາມາດເນັ້ນໃສ່ສຽງຂອງຜູ້ສວມໃສ່ໄດ້ເຖິງແມ່ນວ່າໃນເວລາທີ່ເຂົາເຈົ້າຫັນຫົວຂອງເຂົາເຈົ້າ?
ການປະມວນຜົນໃນອຸປະກອນ: ຫຼີກເວັ້ນລະບົບທີ່ສົ່ງສຽງທັງໝົດໄປຫາຄລາວ (ບັນຫາການຕອບສະໜອງ ແລະຄວາມເປັນສ່ວນຕົວ).
ການຝຶກອົບຮົມແບບກຳນົດເອງ: ເຈົ້າສາມາດສອນຄຳສັ່ງ ແລະສຳນຽງສະເພາະຂອງທີມເຈົ້າໄດ້ບໍ?
ໂໝດອອບລາຍ: ສຽງເຮັດວຽກເມື່ອ Wi-Fi ຫຼຸດລົງບໍ? (Spoiler: ມັນຈະ.)
ການຄວບຄຸມດ້ວຍສຽງໃນການຕັ້ງຄ່າອຸດສາຫະກໍາໄດ້ນໍາໃຊ້ເພື່ອເປັນ punchline. ເຈົ້າຈະເວົ້າກັບແວ່ນຕາຂອງເຈົ້າ, ແລະເຂົາເຈົ້າໄດ້ຍິນເຄື່ອງ, ວິທະຍຸ, ຫຼືບໍ່ມີຫຍັງເລີຍ.
ວ່າມີການປ່ຽນແປງ. Beamforming, ການສະກັດກັ້ນສິ່ງລົບກວນ neural, ແລະການດໍາເນີນການກະດູກໄດ້ເຮັດໃຫ້ສຽງທີ່ເຊື່ອຖືໄດ້ພຽງພໍສໍາລັບການເຮັດວຽກທີ່ແທ້ຈິງ. ມັນບໍ່ສົມບູນແບບ, ແຕ່ ຄົນງານຫຼາຍພັນຄົນໃຊ້ມັນທຸກການປ່ຽນແປງໃນປັດຈຸບັນ.
ມັນກຽມພ້ອມສໍາລັບທຸກໆໂຮງງານບໍ? ບໍ່. ແຕ່ສຳລັບວຽກທີ່ເລືອກ, ກວດກາ, ແລະ ການສ້ອມແປງແບບແນະນຳສ່ວນໃຫຍ່— ແມ່ນແລ້ວ. ແລະມັນດີຂຶ້ນທຸກໆປີ.
ທີ່ SOTECH, ພວກເຮົາໄດ້ຮຽນຮູ້ສຽງບໍ່ແມ່ນການທົດແທນສໍາລັບການສໍາພັດ, ມັນເປັນການເພີ່ມເຕີມ. ຄົນງານບາງຄົນຈະແຕະວັດ, ບາງຄົນຈະ gestures, ບາງຄົນຈະເວົ້າ. ແວ່ນຕາອຸດສາຫະກໍາທີ່ດີທີ່ສຸດສະຫນັບສະຫນູນທັງສາມ - ໃຫ້ຄົນງານເລືອກສິ່ງທີ່ເຮັດວຽກໃນປັດຈຸບັນ.
ເນື່ອງຈາກວ່າຢູ່ໃນຊັ້ນໂຮງງານທີ່ມີສຽງດັງ, ການໂຕ້ຕອບທີ່ດີທີ່ສຸດແມ່ນຫນຶ່ງທີ່ອອກຈາກວິທີການຂອງທ່ານ.
ພ້ອມທີ່ຈະທົດສອບສຽງໃນສະພາບແວດລ້ອມຂອງທ່ານ? ໂທຫາພວກເຮົາ. ພວກເຮົາຈະສົ່ງຄູ່ສາທິດໄປຫາພື້ນທີ່ເຮັດວຽກທີ່ມີສຽງດັງທີ່ສຸດຂອງທ່ານ. ຖ້າມັນເຮັດວຽກຢູ່ທີ່ນັ້ນ, ມັນຈະເຮັດວຽກໄດ້ທຸກບ່ອນ.