Research Article

A Dirichlet Process Mixture Based Name Origin Clustering and Alignment Model for Transliteration

Table 3

Segmentation examples from the BBAM and cDPMM.

cDPMM alignment BBAM alignment

mun 丁 ger 格 (0, English)mun 丁 ger
丁 guo 果 (2, Chinese) 丁 g guo
丁 be 部 (3, Japanese)t 丁 e ibe

fan 范 chun 一 (2, Chinese)fan 范 chun 纯 y  
hong 一 sik 植 (5, Korea)hong 一 l si 植 k
sei 一 ro 郎 (4, Japanese)Seii 静 ch   一 ro

东 b 布 w 夫 s 斯 ki 基 (0, Russian) 东 mb 布 w 夫 s 斯 ki
he 东 chang 昌 (2, Chinese)he 东 gchang
b 布 ran 东 (0, English)b 布 ran