半角アルファベットを全角アルファベットに

senの形態素解析を実行する前に半角アルファベットを全角にする。
でないと、半角アルファベットが「未知語」と判定されちゃう。



public static String hanAl2ZenAl(String s) {

StringBuffer sb = new StringBuffer(s);
for (int i = 0; i < s.length(); i++) {

char c = s.charAt(i);
if (c >= 'a' && c <= 'z') {

sb.setCharAt(i, (char)(c - 'a' + 'a'));

} else if (c >= 'A' && c <= 'Z') {

sb.setCharAt(i, (char)(c - 'A' + 'A'));
}
}

return sb.toString();
}

0 コメント: