「句読点以外の文字列」を表す正規表現

「句読点以外の文字列」を表す正規表現

タイトルどおり、「句読点以外の文字列」を表す正規表現を、備忘録がてら投稿します。


句読点以外の文字列
[^、。]{1,}

^は、「○○以外」を指し、[、。]は 「または」を指すので、[^、。]で 「以外」 の文字ということになります。

{1,} を加える事により、1字以上の繰り返しという意味になります。今回は上限は設定していませんが、[^、。]{1,10} とすれば、「句読点以外の10文字までの文字列」ということになります。

使い道としては、例えば 「だいたい[^、。]{1,}くらい」「各[^、。]{1,}ごと」 などで重複表現を検出するとか、[^、。]{30,} として、読点なしで30文字以上突っ走った文章を検出する、などが考えられます。

この記事を読んだ人にオススメ