【Pythonの基礎】Pythonの内包表記の使い方（初心者向け）

こんにちは、@Yoshimiです。

Pythonといえば・・・内包表記！と誰かがいっていていたきがするのですが、「そんなバカな・・・」と思うのは私だけでしょうか？Pythonの現場では日常に内包表記でコーディングされていることも多いので少しでも慣れておくことをおすすめします。

1 リスト内包表記の基本型
2 ifで条件分岐したリスト内包表記
3 if else的な処理
4 for文の中のfor文がある内包表記
5 zip(), enumerate()との組み合わせ
6 辞書内包表記
7 最後に

リスト内包表記の基本型

これが内包表記です。

a = [1, 2, 3]
b = [x * 10 for x in a]
print(b)

[10, 20, 30]

て、いきなりですいません。

通常のリスト生成を見てみましょう。

a = [1, 2, 3]
b = []
for x in a:
    b.append(x * 10)

print(b)

[10, 20, 30]

となります。

基本構文：
[式 for 任意の変数名 in イテレーター]
となります。

さてもう一例みてみましょう。

ex_a1 = []
for i in range(10):
    ex_a1.append(i)

ex_a2 = [i for i in range(10)]

print('ex_a1:', ex_a1)
print('ex_a2:', ex_a2)

ex_a1: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

ex_a2: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

もちろん同じ結果です。
ポイントは前後が逆になっているという部分です。こんなチープな覚え方ですが、でも早く覚えられた方がいいと思うのです、ということで私はそうやって覚えています。ただ、注意があります。
通常のリスト、for文でプログラムするときは

（空の）リストを用意する
appendで追加している

です。これはあくまでも基本的な部分なので、応用するときには様々な形・形式に変化しますが、ここを抑えておけば大丈夫だと思っています。

いきなり内包表記を覚えるにも何かメリットあるの？となりますが、しっかりメリットはあります。それな処理速度で内包表記の方が早く処理可能ということです。

基本構文作成

%%timeit
extension_1 = []
for i in range(10000):
    extension_1.append(i)

673 µs ± 18.1 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

内包表記で作成

%%timeit
comprehension_1= [i for i in range(10000)]

325 µs ± 14.8 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

µsはマイクロ秒のことです。基本構文（for）と内包表記では、673 µsと325 µsと倍以上の処理い速度です。データ分析では大量データを扱い、複雑なアルゴリズムを利用し解析を行ったり、そのアルゴリズムを複数扱ったりするなどあるので、処理速度は早いに越したことはありません！ということで内包表記をお勧めします。

ifで条件分岐したリスト内包表記

for文にはif文もよくセットで使われています。そのforとifが使われており条件分岐したリストの内包表記の礼を紹介します。

基本構文：
[式 for 任意の変数名 in イテレーター if 条件式]

# 基本系
odds = []
for i in range(10):
    if i % 2 == 1:
        odds.append(i)
        
print(odds)

[1, 3, 5, 7, 9]

i / 2 の剰余を計算し、1か否かで条件分岐がされています。これを内包表記で記述するとこうなります。

odds = [i for i in range(10) if i % 2 == 1]
print(odds)

[1, 3, 5, 7, 9]

結果はもちろんのことながら同じ[1, 3, 5, 7, 9]です。

基本構文(for)に当てはめてみます。

for i in range(10)
if i % 2 == 1
odds.append(i)

というブロックになります。odds = 部分のoddsにappendをつける、append(i)のiを先に記述しています。ただこれだけです。

if else的な処理

三項演算子との組み合わせもみてみます。if~elseもよく使われる構文なので、例外なくチェックしましょう。

基本構文：
[真のときの値 if 条件式 else 偽のときの値 for 任意の変数名 in イテレーター]

まずは、一般的なプログラムをみてみます。i % 2 == 1の計算を行い、計算結果で異なる結果を返しています。

ab_even = []

for i in range(10):
    if i % 2 == 1:
        ab_even.append('aa')
    else:
        ab_even.append('bb')

print(ab_even)

[‘bb’, ‘aa’, ‘bb’, ‘aa’, ‘bb’, ‘aa’, ‘bb’, ‘aa’, ‘bb’, ‘aa’]

これを内包表記で記述します。

odd_even = ['aa' if i % 2 == 1 else 'bb' for i in range(10)]
print(odd_even)

[‘bb’, ‘aa’, ‘bb’, ‘aa’, ‘bb’, ‘aa’, ‘bb’, ‘aa’, ‘bb’, ‘aa’]

もちろんのことながら同じ結果です。
if~elseの内包表記は少し、読みにくいかもしれませんが、これも慣れのようです。単純にコード数も短くなっています。

条件式を前に持ってきており、大元のfor部分は後ろにあります。

for文の中のfor文がある内包表記

まず一般的な（？？？）for文の中にfor文があるプログラム例です。

mx = [[1, 2, 3], [14, 15, 16], [27, 28, 29]]
flat = []

for row in mx:
    for x in row:
        flat.append(x)
        
print(flat)

[1, 2, 3, 14, 15, 16, 27, 28, 29]

内包表記で記述してみます。

flat = [x for row in matrix for x in row]
print(flat)

[1, 2, 3, 14, 15, 16, 27, 28, 29]

[x for row in mx for x in row]ですが、for row in mx部分が大元のfor文、for x in row部分は大元の中でのfor文になります。

zip(), enumerate()との組み合わせ

zip()は複数のリストやタプルなどの要素をまとめる関数で、for文でも多く利用されます。相性がいいのです。

複数のイテラブルをまとめるzip()
インデックスとともに値を返すenumerate()

まずはfor文をみてみましょう。

list_1 = ['a', 'b', 'c']
list_2 = ['x', 'y', 'z']


list_zip = []
for s1, s2 in zip(list_1, list_2):
    list_zip.append((s1, s2))

print(list_zip)

[(‘a’, ‘x’), (‘b’, ‘y’), (‘c’, ‘z’)]

append((s1, s2))で((　))となっていることに気がつきましたか？リストやタプルなどを格納するときに使いますね。内包表記でも同じです。

list_zip = [(s1, s2) for s1, s2 in zip(list_1, list_2)]
print(list_zip)

[(‘a’, ‘x’), (‘b’, ‘y’), (‘c’, ‘z’)]

要素が3つとなっても変わりません。

# 3つ以上も同様
list_3 = ['x', 'y', 'z']

list_zip = [(s1, s2, s3) for s1, s2, s2 in zip(list_1, list_2, list_3)]
print(list_zip)

[(‘a’, ‘x’, ‘z’), (‘b’, ‘y’, ‘z’), (‘c’, ‘z’, ‘z’)]

さらにif構文を組み合わせてみます。
まず、内包表記からみてみましょう。

l_zip_if = [(s1, s2) for s1, s2 in zip(l_str1, l_str2) if s1 != 'b']
print(l_zip_if)

[(‘a’, ‘x’), (‘c’, ‘z’)]

l_zip_if =[]

for s1, s2 in zip(l_str1, l_str2):
    if s1 != 'b':
        l_zip_if.append((s1, s2)) 
    
l_zip_if

[(‘a’, ‘x’), (‘c’, ‘z’)]

x.appned(i)と()が基本なので、内包表記で(s1, s2) でセットされていれば、x.append(())となります。

辞書内包表記

辞書（dict型オブジェクト）も内包表記で生成できます。{}で囲み、式の部分でキーと値の2つをキー: 値のように指定します。

基本構文：
{キー: 値 for 任意の変数名 in イテラブルオブジェクト}

keys = ['k1', 'k2', 'k3']
values = [1, 2, 3]

d = {k: v for k, v in zip(keys, values)}
print(d)

{‘k1’: 1, ‘k2’: 2, ‘k3’: 3}

最後に

ここまで備忘録的にまとめてきましたが、やはりコードを書いて行かないことには覚えていくことができないです。コードに触れることがあれば、とにかく内包表記で書いてみる。ということにチャレンジしても良いかもしれませんね。

ただ、条件式が非常に複雑な場合、無理して内包表記にしなくても良いと思っています。

【Pythonの基礎】Pythonの内包表記の使い方（初心者向け）

リスト内包表記の基本型

ifで条件分岐したリスト内包表記

if else的な処理

for文の中のfor文がある内包表記

zip(), enumerate()との組み合わせ

辞書内包表記

最後に

なりたい自分になれる
スキルアップならUdemy

ABOUTこの記事をかいた人

カテゴリー

これから機械学習を勉強したい人ならおすすめ

リスト内包表記の基本型

ifで条件分岐したリスト内包表記

if else的な処理

for文の中のfor文がある内包表記

zip(), enumerate()との組み合わせ

辞書内包表記

最後に

なりたい自分になれるスキルアップならUdemy

ABOUTこの記事をかいた人

RECOMMENDこちらの記事も人気です。

YahooのYahoo! Finance API をつかって株価予測をする

【Pythonの基礎】リスト・辞書を理解する

【Pythonの基礎】文字を抽出する

Pythonのライブラリpandas-datareaderで株価を取得する

便利すぎるjanomeのAnalyzerモジュール【自然言語処理の基礎】

極性辞書を使用した感情分析に挑戦【自然言語処理の基礎】

決定木(Decision Tree)のアルゴリズムを少し覗いてみる

「次へ」「次のページへ」「NEXT」をPythonとseleniumでス…

カテゴリー

これから機械学習を勉強したい人ならおすすめ

なりたい自分になれる
スキルアップならUdemy