メールのリストやログを受け取ると、空行が混ざり、同じ項目が何度も並び、行末に見えない空白が付いている。Excel に入れて重複削除を回したり短いスクリプトを書いたりするのは面倒です。行単位の整理は、貼り付けてオプションをいくつか入れるだけで終わります。
空行と重複を一度に整える
行整理の基本は4つの操作です。空行の削除、前後の空白の除去、重複の削除、並べ替え。別々に使うより、まとめて有効にすると強力です。
たとえば hello 、空行、world、hello、空白だけの行が混ざったテキストがあるとします。PiPi Worlds の 行整理ツールで前後の空白を除去、空行を削除、重複を削除、昇順で並べ替えを有効にすると、結果は hello、world の2行に減ります。残りの行数がリアルタイムで表示され、元が何行から何行に整ったかがすぐ分かります。
全体の重複と連続の重複は別物
重複削除には2種類あり、結果がかなり違います。
apple、apple、banana、apple の4行を見ます。
| 方式 | 結果 |
|---|---|
| 全体の重複削除 | apple, banana(2行) |
| 連続の重複削除 | apple, banana, apple(3行) |
全体削除はどこにあっても同じ行なら最初の1つだけ残します。連続削除は直前の行と同じときだけ消すので、最後の apple は上が banana のため生き残ります。並びを変えずに連続の繰り返しだけ畳みたいときに連続削除を使います。
適用順序が結果を左右する
見落としがちな点です。操作が適用される順序が決まっています。
前後の空白を除去、空行を削除、重複を削除、並べ替え、行番号の順です。この順序が大事なのは空白のせいです。apple と apple (末尾に空白)は別の行として扱われ、重複が検出されません。空白の除去を先に行うため、この罠が消えます。大文字小文字が違う Apple と apple を同じ行と見るには「大文字小文字を無視」を有効にし、このとき結果には先に現れた表記が残ります。
並べ替えと行番号で仕上げる
整理を終えた行を最後に仕上げる2つが、並べ替えと行番号です。
並べ替えは昇順(A→Z)と降順(Z→A)から選べます。さらに行番号を有効にすると、各行の前に 1.、2.、3. が順に付きます。重複を消して並べ替えたリストに番号まで振れば、文書やメールにそのまま貼れる番号付きリストが一度に仕上がります。
そのリスト、どこで整理していますか
最後はデータが留まる場所の話です。整理のために貼り付ける行には、メールアドレスや社員番号、ログのように外へ出ると困る値が混ざっていることが少なくありません。
PiPi Worlds の 行整理ツールは、すべての処理がブラウザ内で実行され、入力は送信されません。Windows と Mac でコピーして CRLF と LFが混ざったテキストも一度に正規化されます。整理したリストの文字数が気になれば 文字数カウントへ、行ごとに JSON が入っていれば JSON フォーマッターへ続けて確認できます。