【Pythonの基礎】文字を抽出する

こんにちは、@Yoshimiです。

Pythonの基礎の基礎を覚書きしておきます。
Pythonは英語の文法に似ているとのことで他のプログラム言語より習得敷居が扱いやすいと言われているようです。

今回は、データ分析では必須!Pythonの基礎「文字の抽出」です。文字列の任意の部分の文字列を抽出する方法をご紹介します。メールアドレスの抽出や長文でのマスキングの際に任意文字をヒットさせるなど利用用途は様々です。

位置(文字数)を指定して抽出: インデックス、スライス

‘a’

取得する位置を指定することも可能です。

‘X’

データ分析ではよく使う技術「スライシング」ですが、私は未だにパッとできるかというと不安です。

‘abc’

word[:3]では、前から3番目まで取得するという指定なのですが、最初は0と判定されているので、正確には0,1,2までなので、この場合、abcとなります。

‘fg123XYZ’

word[5:]では前から5番目までを削除する(5番目以降を抽出する)です。

‘cde’

word[2:5]では2番目から5番目のひとつ前までです。

‘abcdefg123XY’

word[:-1]は最後の一つを抽出しないでそれ以外です。

‘Z’

word[-1]は最後の一つを抽出するです。

では、大きすぎるインデックスを指定した場合はどうなるのかというとエラーになります。単純です。

基礎的な文字抽出をご紹介しました。もっと柔軟な処理を行う正規表現というものがあります。文字列にマッチした文字のみを抽出する方法など様々な方法で文字抽出が可能です。

まとめ次第ブログでアップしていきます。

ABOUTこの記事をかいた人

Yoshimi

大学卒業して、キラキラしていたのでIT業界にはいりましたが、中身はブラックでした!!だから、投資技術を磨いて早くリタイヤしたいです。株価、Python、機械学習をもうもう勉強中です。