How is language id embedding is learned? #169

mani-rai · 2020-12-16T14:23:24Z

I have been reading this paper to replicate the architecture for my unsupported language pretraining. I was able to grasp everything except learning of language id embedding. Can anyone tell me how embedding is learned? I am assuming it is learned during training as well. Is this true?

hoschwenk · 2021-04-29T09:33:39Z

Which language ID embedding you are referring to ?
The encoder does not use an LID, only the decoder, to know whether it should generate English or Spanish.
It is learned as a parameter as the rest of the network.

loretoparisi · 2023-08-18T16:18:08Z

@hoschwenk regarding LID / LASER I have a clue, and maybe you and the right answer
facebookresearch/fastText#1345

Thanks in advance!

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

How is language id embedding is learned? #169

How is language id embedding is learned? #169

mani-rai commented Dec 16, 2020

hoschwenk commented Apr 29, 2021

loretoparisi commented Aug 18, 2023

How is language id embedding is learned? #169

How is language id embedding is learned? #169

Comments

mani-rai commented Dec 16, 2020

hoschwenk commented Apr 29, 2021

loretoparisi commented Aug 18, 2023