Linux

2016-05-07, linux

変な文字コード'\xc2\xa0'を削除する

WordやLibreOfficeからテキストをコピペしてくると一見空白なのに、変なコードの文字が混ざってくることがあります(cat -vやodで確認できます)。一つ二つならviで編集して消して回ってもOKですが、沢山ある時はsedを使うと便利です。

sed 's/\xc2\xa0/ /g' foo.txt > bar.txt

参考URL

この記事は役に立ちましたか?