Ямар ч хэл үлдээгүй

Ямар ч хэл үлдээгүй

Хиймэл оюун ухааны орчуулгын хүчээр оролцоог жолоодох

Хиймэл оюун ухааны орчуулгын хүчээр оролцоог жолоодох

Видеог үзээрэй
Видеог үзээрэй

Ямар ч хэл

үлдээгүй тухай

Ямар ч хэл үлдээгүй (NLLB) гэдэг нь эх сурвалж багатай Астури, Луганда, Урду зэрэг хэлийг оролцуулаад нийт 200 хэлний хооронд, үнэлэгдсэн, өндөр чанартай орчуулгыг шууд хүргэх боломжтой нээлттэй эхийн загвар бүхий анхны хиймэл оюун ухааны нээлт төсөл юм. Энэ нь хүмүүст төрөлх хэлээрээ веб контент руу нэвтрэх, хуваалцах, хэлний сонголтоосоо үл хамааран хаанаас ч, хэнтэй ч харилцах боломжийг олгох зорилготой юм.

Ямар ч хэл үлдээгүй тухай

Ямар ч хэл үлдээгүй (NLLB) гэдэг нь эх сурвалж багатай Астури, Луганда, Урду зэрэг хэлийг оролцуулаад нийт 200 хэлний хооронд, үнэлэгдсэн, өндөр чанартай орчуулгыг шууд хүргэх боломжтой нээлттэй эхийн загвар бүхий анхны хиймэл оюун ухааны нээлт төсөл юм. Энэ нь хүмүүст төрөлх хэлээрээ веб контент руу нэвтрэх, хуваалцах, хэлний сонголтоосоо үл хамааран хаанаас ч, хэнтэй ч харилцах боломжийг олгох зорилготой юм.

бодит хэрэглээнд зориулсан хиймэл оюун ухааны судалгаа

Бага нөөцтэй хэлийг орчуулахад Facebook, Instagram-д хиймэл оюун ухааны техникийг ашиглах

Бид хүмүүсийг нэгтгэх зорилготой. Тийм ч учраас бид Facebook болон Instagram дээрх эх сурвалж багатай хэлнүүдийн орчуулгыг сайжруулахын тулд загварчлалын техник, NLLB судалгааныхаа мэдлэгээс ашиглаж байна. Эдгээр техник, мэдлэгийг манай бүтээмжийн орчуулгын системд хэрэглэснээр хүмүүс өөрсдийн дуртай хэл эсвэл төрөлх хэлээрээ илүү жинхэнэ, илүү утга учиртай холболт хийх боломжтой болно. Ирээдүйд бид NLLB-ээс эхлэн илүү олон Meta хэрэглүүрүүд рүү мэдлэгээ тэлэх болно гэж найдаж байна.

БОДИТ ЕРТӨНЦИЙН ХЭРЭГЛЭЭ

Хүртээмжтэй метаверсийг бий болгох

Орчуулсан метаверс: хүмүүсийг дэлхийн хэмжээнд нэгтгэх

Метаверсийг бүтээхдээ олон зуун хэл дээр бодит цагийн AR/VR текст орчуулгыг нэгтгэх нь нэн тэргүүний зорилт юм. Бидний зорилго бол хэзээ нэгэн цагт хүн бүр виртуал ертөнцийн контент, төхөөрөмж, туршлагад хандах боломжтой, хэнтэй ч, ямар ч хэлээр метаверсэд харилцах боломжтой болох шинэ стандартыг тогтоох явдал юм. Цаг хугацаа өнгөрөхөд хүмүүсийг дэлхийн хэмжээнд нэгтгэх.

БОДИТ ЕРТӨНЦИЙН ХЭРЭГЛЭЭ

Wikipedia-г хүн бүрд зориулж орчуулах

Сайн дурын редакторуудад мэдээллийг илүү олон хэлээр гаргахад нь туслах

NLLB-200 загварын цаадах технологи нь одоо Wikimedia сангийн Контент орчуулгын хэрэгслээр дамжуулан Wikipedia редакторуудыг эх хэл рүүгээ болон дуртай хэл рүүгээ мэдээлэл орчуулахад нь дэмжлэг үзүүлж байна. Wikipedia редакторууд энэ технологийг Луганда, Исланд зэрэг дутуу илэрхийлэгддэг хэлнээс гаралтай нийтлэлүүдийг илүү үр дүнтэй орчуулж, засварлахад ашиглаж байна. Энэ нь дэлхийн өнцөг булан бүрд байгаа Wikipedia-гийн уншигчдад илүү олон хэлээр илүү их мэдлэг олгоход тусалдаг. Нээлттэй эхийн NLLB-200 загвар нь судлаачид болон сонирхож буй Wikipedia редакторуудын хүрээлэлд бидний ажлыг бүтээхэд туслах болно.

Tech-ийг мэдрээрэй

Орчуулгаар Өгүүлсэн Түүхүүд:

олон зуун хэлээр орчуулагдсан дэлхийн өнцөг булан бүрийн номууд

Орчуулгаар Өгүүлсэн Түүхүүд:

олон зуун хэлээр орчуулагдсан дэлхийн өнцөг булан бүрийн номууд

Орчуулгаар Өгүүлсэн Түүхүүдээр хиймэл оюуны орчуулгын хүчийг мэдрээрэй, Ямар ч хэл үлдээгүй төслийн хамгийн сүүлийн үеийн хиймэл оюун ухааны дэвшилтүүдийг ашигласан манай демо. Энэхүү демо нь Индонез, Сомали, Бирм зэрэг төрөлх хэлнээс нь номуудыг олон хэл рүү уншигчдад зориулан орчуулж, ирэх саруудад хэдэн зуугаараа уншигдах боломжтой болно. Энэхүү санаачилгаар NLLB-200 нь ийм хэмжээний уран зохиол орчуулах боломжтой анхны хиймэл оюун ухаантай загвар болох юм.

Tech

Машины орчуулгыг тайлбарлав

Нээлттэй эхийн NLLB загвар нь 200 хэлийг хэрхэн шууд орчуулдаг вэ?

1-Р ШАТ

Автоматаар өгөгдлийн багц бий болгох

1-р шат: Автоматаар өгөгдлийн багц бий болгох

Оролтын хэл болон хүссэн гаралтын хэл дээрх өгүүлбэрүүдийг агуулсан сургалтын өгөгдлийг цуглуулдаг.

Ямар нэгэн алдаа гарлаа
Энэ бичлэгийг тоглуулахад асуудал гарлаа.

2-Р ШАТ

Сургалт

2-р шат: Сургалт

Олон мянган сургалтын чиглэлүүдэд тохирсон сургалтын өгөгдлийг үүсгэсний дараа энэ өгөгдлийг манай сургалтын загвар дамжуулах системд оруулдаг. Эдгээр загвар нь хоёр хэсгээс бүрдэнэ: оролтын өгүүлбэрийг дотоод вектор дүрслэл болгон хувиргадаг кодлогч; мөн энэ дотоод вектор дүрслэлийг авч, гаралтын өгүүлбэрийг үнэн зөв үүсгэдэг тайлж уншигч. Сая сая жишээ орчуулгад сургаснаар загварууд нь илүү нарийвчлалтай орчуулга үүсгэж сурдаг.

Ямар нэгэн алдаа гарлаа
Энэ бичлэгийг тоглуулахад асуудал гарлаа.

3-Р ШАТ

Үнэлгээ

3-р шат: Үнэлгээ

Эцэст нь орчуулгын чанарт сэтгэл хангалуун байгаагаа батлахын тулд бид загвараа хүний орчуулсан өгүүлбэрийн орчуулгатай харьцуулан үнэлдэг. Үүнд бидний дэмжигдсэн бүх хэлэнд зориулан гаргасан хортой байдлын жагсаалтыг ашиглан хараалын үг болон бусад доромжилсон контентыг илрүүлж, шүүх орно. Үр дүн нь хэлийг шууд орчуулах чадвартай, сайн бэлтгэгдсэн загвар юм.

Ямар нэгэн алдаа гарлаа
Энэ бичлэгийг тоглуулахад асуудал гарлаа.

1-Р ШАТ

Автоматаар өгөгдлийн багц бий болгох

2-Р ШАТ

Сургалт

3-Р ШАТ

Үнэлгээ

1-р шат: Автоматаар өгөгдлийн багц бий болгох

Оролтын хэл болон хүссэн гаралтын хэл дээрх өгүүлбэрүүдийг агуулсан сургалтын өгөгдлийг цуглуулдаг.

Ямар нэгэн алдаа гарлаа
Энэ бичлэгийг тоглуулахад асуудал гарлаа.

2-р шат: Сургалт

Олон мянган сургалтын чиглэлүүдэд тохирсон сургалтын өгөгдлийг үүсгэсний дараа энэ өгөгдлийг манай сургалтын загвар дамжуулах системд оруулдаг. Эдгээр загвар нь хоёр хэсгээс бүрдэнэ: оролтын өгүүлбэрийг дотоод вектор дүрслэл болгон хувиргадаг кодлогч; мөн энэ дотоод вектор дүрслэлийг авч, гаралтын өгүүлбэрийг үнэн зөв үүсгэдэг тайлж уншигч. Сая сая жишээ орчуулгад сургаснаар загварууд нь илүү нарийвчлалтай орчуулга үүсгэж сурдаг.

Ямар нэгэн алдаа гарлаа
Энэ бичлэгийг тоглуулахад асуудал гарлаа.

3-р шат: Үнэлгээ

Эцэст нь орчуулгын чанарт сэтгэл хангалуун байгаагаа батлахын тулд бид загвараа хүний орчуулсан өгүүлбэрийн орчуулгатай харьцуулан үнэлдэг. Үүнд бидний дэмжигдсэн бүх хэлэнд зориулан гаргасан хортой байдлын жагсаалтыг ашиглан хараалын үг болон бусад доромжилсон контентыг илрүүлж, шүүх орно. Үр дүн нь хэлийг шууд орчуулах чадвартай, сайн бэлтгэгдсэн загвар юм.

Ямар нэгэн алдаа гарлаа
Энэ бичлэгийг тоглуулахад асуудал гарлаа.

Инновацууд

Энэхүү нээлтийн цаадах шинжлэх ухаан

Өнөөгийн ихэнх машин орчуулга (MT)-ын загварууд нь дундаас дээш өндөр эх сурвалжтай хэл дээр ажилладаг ба ихэнх бага эх сурвалжтай хэлүүдийг үлдээсэн байдаг. Meta-гийн хиймэл оюун ухааны судлаачид хиймэл оюун ухааны гурван чухал инновацаар энэ асуудлыг шийдэж байна.

Бага эх сурвалжтай хэлнүүдэд зориулсан автомат өгөгдлийн багц бүтээх

Хам сэдэв

Машины орчуулга нь хяналттай сургалтын даалгавар бөгөөд энэ нь загварт суралцахын тулд өгөгдөл хэрэгтэй гэсэн үг юм. Нээлттэй эхийн өгөгдлийн цуглуулгаас орчуулсан жишээг ихэвчлэн ашигладаг. Бидний шийдэл бол нэг хэлтэй баримт бичгийн янз бүрийн цуглуулгад өгүүлбэрүүдийг хослуулах замаар орчуулгын хослолыг автоматаар бүтээх явдал юм.

Сорилт

Энэхүү өгөгдлийн багц үүсгэх үйл явцад ашигласан LASER загварууд нь дунд болон өндөр эх сурвалжтай хэлнүүдийг дэмждэг тул бага эх сурвалжтай хэлнүүдэд үнэн зөв орчуулга хийх боломжгүй болгодог.

Инновац

Бид үүнийг багш-оюутны сургалтын журамд хөрөнгө оруулснаар шийдэж, 1) LASER-ийн хэлний хамрах хүрээг 200 хэл болгон өргөжүүлэх, 2) эх сурвалж багатай хэлний хувьд ч асар их хэмжээний өгөгдөл гаргах боломжтой болгосон.

200 хэлийг загварчлах

Хам сэдэв

Олон хэлний машины орчуулгын системийг хоёр хэлний систем дээр сайжруулсан. Энэ нь сургалтын өгөгдөл ихтэй хос хэлнээс сургалтын нөөц багатай бусад хэл рүү “шилжүүлэх” чадвартай холбоотой юм.

Сорилт

Олон зуун хэлний хослолыг хамт сургах нь сул талуудтай, учир нь ижил загвар нь ижил тооны параметр бүхий улам олон тооны хэлийг илэрхийлэх ёстой. Энэ нь өгөгдлийн багцын хэмжээ тэнцвэргүй байх үед тохиолддог асуудал бөгөөд энэ нь хэт тохируулга үүсгэж болзошгүй юм.

Инновац

Бид хуваалцсан болон тусгай хүчин чадалтай Sparse шинжээчдийн холимог загварыг боловсруулсан тул их өгөгдөлгүй бага эх сурвалжтай хэлнүүдийг автоматаар хуваалцсан багтаамж руу чиглүүлэх боломжтой. Илүү сайн тогтворжуулах системтэй хослуулсан тохиолдолд энэ нь хэт тохируулгаас зайлсхийдэг. Цаашилбал, бид олон төрлийн буцаан орчуулгын тусламжтайгаар бие даан суралцах, том хэмжээний өгөгдлийг нэмэгдүүлэх аргыг ашигласан.

Орчуулгын чанарыг үнэлэх

Хам сэдэв

Манай загвараар хийсэн орчуулга нь манай чанарын стандартад нийцэж байгаа эсэхийг мэдэхийн тулд бид үүнийг үнэлэх ёстой.

Сорилт

Машины орчуулгын загварыг ихэвчлэн машин орчуулсан өгүүлбэрийг хүний орчуулгатай харьцуулах замаар үнэлдэг боловч олон хэлний хувьд орчуулгын найдвартай өгөгдөл байдаггүй. Тиймээс үнэн зөв үнэлгээ өгөх боломжгүй.

Инновац

Бид хүний орчуулсан үнэлгээний жишиг болох FLORES-ийн хамрах хүрээг 2 дахин нэмэгдүүлж, одоо 200 хэлийг хамарч байна. Автомат хэмжигдэхүүн болон хүний ​​үнэлгээний дэмжлэгтэйгээр бид орчуулгынхаа чанарыг өргөнөөр үнэлэх боломжтой.
NLLB-ийн цаадах шинжлэх ухааны талаар илүү ихийг олж мэдэхийн тулд манай танилцуулга болон блогийгуншиж, энэ төслийг цаашид хэрэгжүүлэхэд туслах загварыг татаж аваарай.

NLLB-ийн цаадах шинжлэх ухааны талаар илүү ихийг олж мэдэхийн тулд манай танилцуулга болон блогийг уншиж, энэ төслийг цаашид хэрэгжүүлэхэд туслах загварыг татаж аваарай.

Аялал

Судалгааны үе шатууд
Судалгааны үе шатууд

Meta-гийн хиймэл оюун ухаан нь эх сурвалж багатай хэлний өгөгдөл байхгүй байдлаас эхлээд орчуулгын чанар, үнэн зөв байдал хүртэл маш олон салбарын сорилтуудыг амжилттай даван туулахын зэрэгцээ машин орчуулгын технологийг ахиулсаар ирсэн. Хиймэл оюун ухааны орчуулгын хүчээр оролцоог жолоодох бидний аялал үргэлжилсээр байна.

Meta-гийн хиймэл оюун ухаан нь эх сурвалж багатай хэлний өгөгдөл байхгүй байдлаас эхлээд орчуулгын чанар, үнэн зөв байдал хүртэл маш олон салбарын сорилтуудыг амжилттай даван туулахын зэрэгцээ машин орчуулгын технологийг ахиулсаар ирсэн. Хиймэл оюун ухааны орчуулгын хүчээр оролцоог жолоодох бидний аялал үргэлжилсээр байна.

Загварын үе шатуудыг гаргасан # хэлээр харна уу

< 50 хэл

50—99 хэл

100 хэл

200 хэл

LASER (Хэлний агностик өгүүлбэрийн дүрслэл)

2018

NLP хүрээлэлтэй олон нийтэд хуваалцсан олон хэл дээрх өгүүлбэрүүдийн анхны амжилттай судалгаа. Кодлогч нь 50 хэл дээрх ижил утгатай өгүүлбэрүүдийг автоматаар хослуулахын тулд оруулга үүсгэдэг.

Өгөгдөл кодлогчид

WMT-19

2019

FB хиймэл оюун ухааны загварууд нь WMT 2019-д бусад бүх загвараас давж, том хэмжээний түүвэрчилсэн орчуулга, дуу чимээтэй сувгийн загварчлал, өгөгдөл цэвэрлэх арга техникийг ашиглан хүчирхэг системийг бий болгосон.

Загвар

Flores V1

2019

2 хэлнээс эхлээд шударга бөгөөд нарийн үнэлгээний үйл явцыг нэвтрүүлсэн англи хэл болон бага эх сурвалжтай хэлнүүдийн хоорондын машины орчуулгын жишиг өгөгдлийн багц.

Үнэлгээний өгөгдлийн багц

WikiMatrix

2019

Олон хэл дээрх зэрэгцээ өгүүлбэрүүдийн хамгийн том задрал: Илүү сайн орчуулгын загвар бүтээхийн тулд 1620 хэлний хослолоор 135 сая Wikipedia өгүүлбэрийг бит текстээр задалсан.

Өгөгдөл бий болгох

M2M-100

2020

Англи хэл дээрх өгөгдөлд найдахгүйгээр дурын хос 100 хэлний хооронд шууд орчуулах анхны, олон хэл дээрх машин орчуулгын загвар. Өмнөх олон хэлтэй загваруудаас 10 дахин их—2200 хэлний чиглэлээр сургасан.

Загвар

CCMatrix

2020

Илүү олон хэл, ялангуяа эх сурвалж багатай хэлнүүдтэй ажиллах илүү сайн орчуулгын загвар бүтээхэд зориулсан өндөр чанартай, вебэд суурилсан бит текстүүдийн хамгийн том өгөгдлийн багц: 576 хос хэлний 4,5 тэрбум зэрэгцээ өгүүлбэр.

Өгөгдөл бий болгох

LASER 2

2020

100 хэл дээр ижил утгатай өгүүлбэрүүдийг автоматаар хослуулахын тулд шигтгээ үүсгэдэг.

Өгөгдөл кодлогчид

WMT-21

2021

Дан олон хэлтэй загвар нь анх удаагаа WMT 2021-д 14 хэлний хосын 10-д нь тусгайлан бэлтгэгдсэн хос хэлний шилдэг загваруудыг гүйцэж түрүүлж, бага болон их эх сурвалжтай хэлний аль алинд нь хамгийн сайн орчуулга хийсэн.

Загвар

FLORES-101

2021

FLORES-101 нь 101 хэлийг хамарсан анхны, олноос олонд үнэлгээний өгөгдлийн багц бөгөөд судлаачдад M2M-100 гэх мэт олон хэл дээрх орчуулгын загварыг хурдан турших, сайжруулах боломжийг олгодог.

Үнэлгээний өгөгдлийн багц

NLLB-200

2022

NLLB загвар нь 200 хэл орчуулдаг.

Загвар

FLORES-200

2021

Одоо 200 хэлийг хамарсан FLORES үнэлгээний өгөгдлийн багцын өргөжилт

Үнэлгээний өгөгдлийн багц

NLLB-Data-200

2022

200 хэлний сургалтын өгөгдлийг бүтээж, гаргасан

Үнэлгээний өгөгдлийн багц

LASER 3

2022

200 хэл дээр ижил утгатай өгүүлбэрүүдийг автоматаар хослуулахын тулд шигтгээ үүсгэдэг.

Өгөгдөл кодлогчид

< 50 хэл

50—100 хэл

100 хэл

200 хэл

LASER (Хэлний агностик өгүүлбэрийн дүрслэл)

2018

NLP хүрээлэлтэй олон нийтэд хуваалцсан олон хэл дээрх өгүүлбэрүүдийн анхны амжилттай судалгаа. Кодлогч нь 50 хэл дээрх ижил утгатай өгүүлбэрүүдийг автоматаар хослуулахын тулд оруулга үүсгэдэг.

Өгөгдөл кодлогчид

WMT-19

2019

FB хиймэл оюун ухааны загварууд нь WMT 2019-д бусад бүх загвараас давж, том хэмжээний түүвэрчилсэн орчуулга, дуу чимээтэй сувгийн загварчлал, өгөгдөл цэвэрлэх арга техникийг ашиглан хүчирхэг системийг бий болгосон.

Загвар

Flores V1

2019

2 хэлнээс эхлээд шударга бөгөөд нарийн үнэлгээний үйл явцыг нэвтрүүлсэн англи хэл болон бага эх сурвалжтай хэлнүүдийн хоорондын машины орчуулгын жишиг өгөгдлийн багц.

Үнэлгээний өгөгдлийн багц

WikiMatrix

2019

Олон хэл дээрх зэрэгцээ өгүүлбэрүүдийн хамгийн том задрал: Илүү сайн орчуулгын загвар бүтээхийн тулд 1620 хэлний хослолоор 135 сая Wikipedia өгүүлбэрийг бит текстээр задалсан.

Өгөгдөл бий болгох

M2M-100

2020

Англи хэл дээрх өгөгдөлд найдахгүйгээр дурын хос 100 хэлний хооронд шууд орчуулах анхны, олон хэл дээрх машин орчуулгын загвар. Өмнөх олон хэлтэй загваруудаас 10 дахин их—2200 хэлний чиглэлээр сургасан.

Загвар

CCMatrix

2020

Илүү олон хэл, ялангуяа эх сурвалж багатай хэлнүүдтэй ажиллах илүү сайн орчуулгын загвар бүтээхэд зориулсан өндөр чанартай, вебэд суурилсан бит текстүүдийн хамгийн том өгөгдлийн багц: 576 хос хэлний 4,5 тэрбум зэрэгцээ өгүүлбэр.

Өгөгдөл бий болгох

LASER 2

2020

100 хэл дээр ижил утгатай өгүүлбэрүүдийг автоматаар хослуулахын тулд шигтгээ үүсгэдэг.

Өгөгдөл кодлогчид

WMT-21

2021

Дан олон хэлтэй загвар нь анх удаагаа WMT 2021-д 14 хэлний хосын 10-д нь тусгайлан бэлтгэгдсэн хос хэлний шилдэг загваруудыг гүйцэж түрүүлж, бага болон их эх сурвалжтай хэлний аль алинд нь хамгийн сайн орчуулга хийсэн.

Загвар

FLORES-101

2021

FLORES-101 нь 101 хэлийг хамарсан анхны, олноос олонд үнэлгээний өгөгдлийн багц бөгөөд судлаачдад M2M-100 гэх мэт олон хэл дээрх орчуулгын загварыг хурдан турших, сайжруулах боломжийг олгодог.

Үнэлгээний өгөгдлийн багц

NLLB-200

2022

NLLB загвар нь 200 хэл орчуулдаг.

Загвар

FLORES-200

2021

Одоо 200 хэлийг хамарсан FLORES үнэлгээний өгөгдлийн багцын өргөжилт

Үнэлгээний өгөгдлийн багц

NLLB-Data-200

2022

200 хэлний сургалтын өгөгдлийг бүтээж, гаргасан

Үнэлгээний өгөгдлийн багц

LASER 3

2022

200 хэл дээр ижил утгатай өгүүлбэрүүдийг автоматаар хослуулахын тулд шигтгээ үүсгэдэг.

Өгөгдөл кодлогчид

From Assamese, Balinese and Estonian…to Icelandic, Igbo and more. 200 languages and counting…

Have a look at the full list of languages our NLLB-200 model supports—with 150 low-resource languages included. More will be added to this list as we, and our community, continue on this journey of inclusiveness through AI translation.

Full list of supported languages

Acehnese (Latin script)

Arabic (Iraqi/Mesopotamian)

Arabic (Yemen)

Arabic (Tunisia)

Afrikaans

Arabic (Jordan)

Akan

Amharic

Arabic (Lebanon)

Arabic (MSA)

Arabic (Modern Standard Arabic)

Arabic (Saudi Arabia)

Arabic (Morocco)

Arabic (Egypt)

Assamese

Asturian

Awadhi

Aymara

Crimean Tatar

Welsh

Danish

German

French

Friulian

Fulfulde

Dinka(Rek)

Dyula

Dzongkha

Greek

English

Esperanto

Estonian

Basque

Ewe

Faroese

Iranian Persian

Icelandic

Italian

Javanese

Japanese

Kabyle

Kachin | Jinghpo

Kamba

Kannada

Kashmiri (Arabic script)

Kashmiri (Devanagari script)

Georgian

Kanuri (Arabic script)

Kanuri (Latin script)

Kazakh

Kabiye

Thai

Khmer

Kikuyu

South Azerbaijani

North Azerbaijani

Bashkir

Bambara

Balinese

Belarusian

Bemba

Bengali

Bhojpuri

Banjar (Latin script)

Tibetan

Bosnian

Buginese

Bulgarian

Catalan

Cebuano

Czech

Chokwe

Central Kurdish

Fijian

Finnish

Fon

Scottish Gaelic

Irish

Galician

Guarani

Gujarati

Haitian Creole

Hausa

Hebrew

Hindi

Chhattisgarhi

Croatian

Hugarian

Armenian

Igobo

IIocano

Indonesian

Kinyarwanda

Kyrgyz

Kimbundu

Konga

Korean

Kurdish (Kurmanji)

Lao

Latvian (Standard)

Ligurian

Limburgish

Lingala

Lithuanian

Lombard

Latgalian

Luxembourgish

Luba-Kasai

Ganda

Dholuo

Mizo

Full list of supported languages

Acehnese (Latin script)

Arabic (Iraqi/Mesopotamian)

Arabic (Yemen)

Arabic (Tunisia)

Afrikaans

Arabic (Jordan)

Akan

Amharic

Arabic (Lebanon)

Arabic (MSA)

Arabic (Modern Standard Arabic)

Arabic (Saudi Arabia)

Arabic (Morocco)

Arabic (Egypt)

Assamese

Asturian

Awadhi

Aymara

Crimean Tatar

Welsh

Danish

German

French

Friulian

Fulfulde

Dinka(Rek)

Dyula

Dzongkha

Greek

English

Esperanto

Estonian

Basque

Ewe

Faroese

Iranian Persian

Icelandic

Italian

Javanese

Japanese

Kabyle

Kachin | Jinghpo

Kamba

Kannada

Kashmiri (Arabic script)

Kashmiri (Devanagari script)

Georgian

Kanuri (Arabic script)

Kanuri (Latin script)

Kazakh

Kabiye

Thai

Khmer

Kikuyu

South Azerbaijani

North Azerbaijani

Bashkir

Bambara

Balinese

Belarusian

Bemba

Bengali

Bhojpuri

Banjar (Latin script)

Tibetan

Bosnian

Buginese

Bulgarian

Catalan

Cebuano

Czech

Chokwe

Central Kurdish

Fijian

Finnish

Fon

Scottish Gaelic

Irish

Galician

Guarani

Gujarati

Haitian Creole

Hausa

Hebrew

Hindi

Chhattisgarhi

Croatian

Hugarian

Armenian

Igobo

IIocano

Indonesian

Kinyarwanda

Kyrgyz

Kimbundu

Konga

Korean

Kurdish (Kurmanji)

Lao

Latvian (Standard)

Ligurian

Limburgish

Lingala

Lithuanian

Lombard

Latgalian

Luxembourgish

Luba-Kasai

Ganda

Dholuo

Mizo

NLLB-200 загвараар орчуулсан 200 хэл, манай өмнөх загвараас 2 дахин

Манай эцсийн загвар нь өмнөх хамгийн сүүлийн загвартай харьцуулахад BLEU-ийн гүйцэтгэлийг +44% сайжруулсан

Өмнө нь арилжааны орчуулгын системээр дэмжигдээгүй 75 хэл

18 тэрбум зэрэгцээ өгүүлбэр, өмнөх M2M-100 загвараас 2,5 дахин их сургалтын өгөгдөл

Хамгийн том нээлттэй эхийн машин орчуулгын загвар 54B, өмнөх M2M-100 загвараас 5 дахин том параметрийн тоо

Нэг загвараар дэмжигдсэн 40 000 орчуулгын чиглэл—өмнөх жишиг үзүүлэлтээс 4 дахин их хүчин чадалтай

NLLB-ийн судалгааны дэвшил нь Facebook-ийн Мэдээний суваг, Instagram болон бусад платформ дээр өдөр бүр үйлчилдэг 25 тэрбум гаруй орчуулгыг дэмждэг.

NLLB-200 загвараар орчуулсан 200 хэл, манай өмнөх загвараас 2 дахин

Манай эцсийн загвар нь өмнөх хамгийн сүүлийн загвартай харьцуулахад BLEU-ийн гүйцэтгэлийг +44% сайжруулсан

Өмнө нь арилжааны орчуулгын системээр дэмжигдээгүй 75 хэл

18 тэрбум зэрэгцээ өгүүлбэр, өмнөх M2M-100 загвараас 2,5 дахин их сургалтын өгөгдөл

Хамгийн том нээлттэй эхийн машин орчуулгын загвар 54B, өмнөх M2M-100 загвараас 5 дахин том параметрийн тоо

Нэг загвараар дэмжигдсэн 40 000 орчуулгын чиглэл—өмнөх жишиг үзүүлэлтээс 4 дахин их хүчин чадалтай

NLLB-ийн судалгааны дэвшил нь Facebook-ийн Мэдээний суваг, Instagram болон бусад платформ дээр өдөр бүр үйлчилдэг 25 тэрбум гаруй орчуулгыг дэмждэг.

Дэлгэрэнгүй олж мэдэх

Цаашид Ямар ч хэл үлдээгүй гэдгийг хамтдаа авч үзье.

NLLB-ийн талаар илүү ихийг сурч мэдэх, үүнтэй хамт хийж бүтээх илүү их зүйл бий. Дэлгэрэнгүй мэдээллийг манай цахим хуудас болон блогоос уншаад, энэ төслийг цаашид хэрэгжүүлэхэд туслах загварыг татаж аваарай. Бид 200 хэлтэй болсон ч дөнгөж эхэлж байна. Бидэнтэй нэгдэж, бидэнтэй хамт бүтээж, орчуулга, оролцооны энэхүү чухал аяныг үргэлжлүүлээрэй.