RedPen v1.4 のリリース

ATL の takahi_i です。

RedPen の v1.4 をリリースしました。v1.4の RedPen は以下の URL からダウンロードできます。また、ご利用の OS が MacOS をであれば、Homebrew を利用して RedPen v1.4 をインストールできます。

https://github.com/redpen-cc/redpen/releases/tag/v1.4.0

リリース v1.4 の目玉は LaTeX 対応と、機能強化です。以下各トピックについて解説します。

LaTeX 対応

今回のリリースでは LaTeX フォーマットへの対応を開始しました。LaTeX のサポートは RedPen の開発当初から多かったリクエストです。v0.6 のリリースから一年以上かけてやっとの対応となりました。

残念ながら現状の LaTeX サポートには以下の制限があります。

  1. RedPen の LaTeX パーサはマクロによる自分用のタグを追加した際にうまく動作しない
  2. リスト内に存在する文の検査には対応していない

大きな制約ではありますが、初学者が論文や文書を検査するのには使えるのではないかと考えています。

機能の強化

v1.4 では機能(Validator)の強化を集中的に行いました。追加した機能には 日本語、英語の両方に対応したもの日本語のみに対応したもの英語のみに対応したものの三種類があります。

日本語、英語の両方に対応した機能

  • DoubleNegative: 英語でも日本語でも二重否定の文は理解しにくいです。DoubledNegative は二重否定が文中に存在した場合にエラーを出力します。

日本語のみに対応した機能

  • Okurigana: 日本語の送り仮名が一般的な用法とことなるときにエラーを出力します。たとえば、以下の文は送り仮名のミスがあります。

費してではなく費やしてが正解です。上の文が入力文書に存在すると Okurigana はエラーを出力します。

  • DoubledJoshi: 同じ助詞が一文で使用されると読みにくいことがあります。特に格助詞 “の” の過剰利用はよく行われます。たとえば以下の文をみてみましょう。

文中で “の” が二回利用されていますが、格助詞の “の” は曖昧性をはらんでいます。以下のように “の” を置き換えることで、文書が入力である点が強調され理解しやすくなります。

英語のみに対応した機能

  • FrequentSentenceStart: 英語文書を書いていると、おなじ表現から始まる文が続いてしまうことがあります。おなじ表現から文が開始してしまう状況は、体裁が悪いので早めに置き換えたいものです。たとえば以下のような例が考えられます。

上の例ではふたつの文が連続して We から始まっています。二文目の主語を We から置き換えてあげると意味をかえずに、おなじ文頭表現の連続を防げます。

  • UnexpandedAcronym: 短縮系で表現される単語への元の単語列(非短縮形)が文書中に存在するかを検査します。たとえば、SVM という単語が文中に存在した場合には、元の単語列 Support Vector Machine も文書中に存在しないとエラーが出力されます。
  • WordFrequency: 文書内に存在する単語頻度が、一般的な場合と異なる際エラーを出力します。
  • Hyphenation: ハイフンの利用が一般的でない場合にエラーを出力します。
  • NumberFormat: 数字表現が英語の一般的な用法と異なる場合にエラーを出力します。
  • ParenthesizedSentence: 括弧の用法について検査を行います。ネストした括弧や、指定以上の括弧が入力文存在した場合にエラーを出力します。
  • WeakExpression: 曖昧な英語表現が文中に存在するとエラーを出力します。たとえば completely や huge などの単語はもっと精確な表現に置きかえるべきです。

バージョン 1.5 の展望

RedPen のバージョン 1.5 にむけて開発が続く予定です。実はまだ優先づけができていないのですが、v1.5 では JavaScript で書かれた機能を簡単にテストできる機構が入ることが決まっています。また、英語用の機能を日本語でも動作させられるように実装を拡張してゆく予定です。

また v1.5 をリリースするまえに、現状報告されているいくつかのバグを修正した v1.4.1 をリリースする予定です。今後共どうぞよろしくお願いいたいます。