【ハンドメイドで稼ぐ】pythonとGASでメルカリをデータ分析したら売上2.4倍くらいに増えそう

メルカリ

プログラミングから逸脱しレザークラフトにどハマりしているスマイルです(‘ω’)ノ

最近はスクリプトより下記のようなバックとか作っていまして(@diy_programming)、勉強し始めて半年くらいにしてはいい出来だと自画自賛しまくってます笑

実際にメルカリで売ってますんで興味のある方は画像クリックで商品ページを確認できます、そして買って下さいm(_ _)m

んで、こうやって作った物をメルカリに出品している途中でいくつか疑問が出てきました。

  • 見込み客が多く、購入率の高いカテゴリーが知りたい
  • 売れる価格帯が知りたい
  • 売れない価格帯が知りたい
  • タイトルや商品説明に使用する「頻出キーワード / 流行キーワード」が知りたい
  • 売れ筋のカラー / デザイン / 素材が知りたい

要するに作った物を早く・高く売るために出品時に出来る事を全部やりたいという事なんですが、こればっかりはメルカリ内の膨大なデータを分析しない事には分かりません。ので、膨大なデータを分析してやりました

集計結果

集計は「メルカリ > ハンドメイド > ファッション小物 > 女性用バッグ、男性用バッグ、女性用財布、男性用財布」の4つのカテゴリから、「アイテム件数・販売金額集計」「ヒストグラム」「頻出キーワード」を作ってみたいと思います。

これらの集計から、

  • カテゴリ別の規模感の把握
  • 販売金額のボリュームゾーンを調べる
  • 頻出キーワードの上位から人気アイテムを探る

こんくらい把握できれば「何を作って」「どのカテゴリに出品して」「いくらで販売するか」の基準が大体分かるんじゃないかな~と思います。

データ収集の仕組みやトリミングのアイデアなど技術的な話は一番下に書いてありますんで、興味のある方は最後の方を読んでみて下さい。

アイテム件数・販売金額集計

全体SOLD売れ残り
トリミング件数金額平均件数金額平均SOLD率件数金額平均売れ残り率
バック(女性用)1,235 件10,130 件28,192,542 円2,783 円1,896 件5,505,879 円2,904 円19%8,234 件22,686,663 円2,755 円81%
バック(男性用)409 件3,230 件16,015,374 円4,958 円1,012 件3,322,774 円3,283 円31%2,218 件12,692,600 円5,723 円69%
財布(女性用)1,942 件8,854 件26,259,739 円2,966 円3,974 件11,639,974 円2,929 円45%4,880 件14,619,765 円2,996 円55%
財布(男性用)793 件5,315 件35,533,973 円6,686 円1,691 件7,679,392 円4,541 円32%3,624 件27,854,581 円7,686 円68%

ヒストグラム

SOLD済みアイテム頻出キーワードトップ100

順位バッグ女性バッグ男性財布女性財布男性
1(‘バッグ’, 1471)(‘バッグ’, 552)(‘財布’, 3011)(‘財布’, 933)
2(‘ハンドメイド’, 962)(‘ハンドメイド’, 268)(‘ハンドメイド’, 1830)(‘レザー‘, 457)
3(‘トート‘, 780)(‘ショルダー‘, 216)(‘口’, 736)(‘ウォレット’, 454)
4(‘リメイク‘, 337)(‘トート‘, 199)(‘がま口‘, 626)(‘ハンドメイド’, 373)
5(‘ショルダー‘, 254)(‘リメイク‘, 178)(‘親子‘, 626)(‘ケース’, 320)
6(‘バック’, 225)(‘袋’, 153)(‘ミニ‘, 594)(‘コイン‘, 242)
7(‘ミニ‘, 182)(‘帆布‘, 127)(‘ケース’, 440)(‘本革‘, 228)
8(‘デニム‘, 174)(‘ポーチ‘, 109)(‘ポーチ‘, 432)(‘折り‘, 165)
9(‘柄’, 160)(‘デニム‘, 106)(‘ファスナー‘, 398)(‘栃木‘, 143)
10(‘ポーチ‘, 157)(‘バック’, 72)(‘本革‘, 305)(‘小銭‘, 140)
11(‘巾着’, 110)(‘頭陀‘, 62)(‘カード‘, 296)(‘二’, 137)
12(‘帆布‘, 106)(‘レザー‘, 60)(‘柄’, 283)(‘ミニ‘, 137)
13(‘サイズ’, 77)(‘ボディ‘, 53)(‘リバティ’, 270)(‘ファスナー‘, 127)
14(‘ポケット’, 76)(‘2’, 52)(‘ミナペルホネン’, 250)(‘トラッカー‘, 116)
15(‘着物‘, 75)(‘巾着‘, 50)(‘字’, 249)(‘サドル‘, 110)
16(‘ミナペルホネン’, 74)(‘和柄’, 50)(‘小銭‘, 242)(‘革’, 95)
17(‘コヤンイサムチョン’, 66)(‘サコッシュ’, 48)(‘ウォレット’, 236)(‘コンパクト’, 94)
18(‘北欧’, 62)(‘柄’, 46)(‘レザー‘, 227)(‘ヌメ革’, 93)
19(‘2’, 59)(‘本革’, 40)(‘コイン‘, 217)(‘手縫い’, 87)
20(‘点’, 57)(‘グリーン’, 40)(‘L’, 191)(‘ブラック’, 85)
21(‘エコ’, 56)(‘生地’, 40)(‘コンパクト’, 142)(‘カード’, 81)
22(‘ブラック‘, 54)(‘スマホ’, 39)(‘猫’, 140)(‘クラフト’, 78)
23(‘パッチワーク’, 52)(‘ケース’, 37)(‘入れ’, 138)(‘L’, 76)
24(‘No.’, 51)(‘サイズ’, 37)(‘ラウンド’, 131)(‘牛革’, 73)
25(‘way’, 50)(‘号’, 33)(‘デニム’, 125)(‘新品’, 70)
26(‘使用’, 49)(‘黒’, 33)(‘やりくり’, 122)(‘ミドル’, 56)
27(‘サイド’, 49)(‘ミニ’, 32)(‘2’, 109)(‘字’, 53)
28(‘サコッシュ’, 48)(‘信玄’, 32)(‘ポケット’, 105)(‘コンチョ’, 49)
29(‘刺繍’, 48)(‘ベルト’, 31)(‘使用’, 101)(‘使用’, 46)
30(‘猫’, 47)(‘ブラウン’, 31)(‘リメイク’, 99)(‘入れ’, 46)
31(‘スマホ’, 46)(‘Type’, 31)(‘花柄’, 99)(‘ラウンド’, 44)
32(‘ロラライハリス’, 43)(‘セット’, 30)(‘W’, 97)(‘ロング’, 42)
33(‘花柄’, 42)(‘前掛け’, 28)(‘ハーフ’, 96)(‘2’, 42)
34(‘4’, 42)(‘ブラック’, 26)(‘北欧’, 96)(‘値下げ’, 42)
35(‘生地’, 42)(’11’, 25)(‘新品’, 95)(‘デニム’, 42)
36(‘黒’, 41)(‘4’, 24)(‘ピンク’, 94)(‘コードバン’, 38)
37(‘ピンク’, 41)(‘手作り’, 24)(‘ブラック’, 93)(‘ブラウン’, 36)
38(‘セット’, 40)(‘オリーブ’, 22)(‘ユキエモン’, 85)(‘小型’, 36)
39(‘ポシェット’, 40)(‘ウエスト’, 21)(‘L’, 85)(‘黒’, 35)
40(‘A’, 40)(‘way’, 20)(‘折り’, 83)(‘馬蹄’, 34)
41(‘リバティ’, 40)(‘紐’, 20)(‘ロラライハリス’, 81)(‘マネー’, 32)
42(‘グラニーバッグ’, 39)(‘値下げ’, 19)(‘刺繍’, 79)(‘クリップ’, 32)
43(‘帯’, 39)(‘古布’, 19)(‘4’, 77)(‘ゴダン’, 32)
44(‘リネン’, 38)(‘ポシェット’, 19)(‘レース’, 75)(‘ハイカー’, 32)
45(‘がま口’, 37)(‘A’, 19)(‘スマホ’, 75)(‘メンズ’, 31)
46(‘イン’, 36)(‘酒屋’, 19)(‘革’, 72)(‘カスタム’, 30)
47(‘グレー’, 36)(‘米袋’, 19)(‘金’, 72)(‘サイズ’, 29)
48(‘フラワー’, 35)(‘使用’, 18)(‘アコーディオン’, 71)(‘GODANE’, 29)
49(‘花’, 35)(’22’, 18)(‘プリント’, 70)(‘ハーフ’, 27)
50(‘ハンドバッグ’, 33)(‘ポケット’, 18)(‘ネイビー’, 69)(‘姫路’, 27)
51(‘ファスナー’, 33)(‘ブルー’, 18)(‘パッチワーク’, 67)(‘イタリアン’, 25)
52(‘手提げ’, 32)(‘牛革’, 17)(‘生地’, 67)(‘リメイク’, 25)
53(‘肩掛け’, 31)(‘革’, 17)(‘クラフト’, 67)(‘セット’, 24)
54(‘女の子’, 30)(‘着物’, 17)(‘牛革’, 67)(‘牛’, 24)
55(‘コットン’, 29)(‘メンズ’, 17)(‘ヌメ革’, 64)(‘白蛇’, 23)
56(‘グリーン’, 28)(‘クラッチ’, 16)(‘物入れ’, 64)(‘X’, 23)
57(‘モチーフ’, 28)(‘ファスナー’, 16)(‘段’, 62)(‘がま口’, 23)
58(‘手編み’, 28)(‘男女’, 16)(‘二’, 61)(‘3’, 22)
59(‘号’, 28)(‘ヌメ革’, 16)(‘口金’, 60)(‘グリーン’, 22)
60(‘散歩’, 27)(‘large’, 16)(’10’, 60)(‘ショート’, 22)
61(‘ネイビー’, 27)(‘4’, 16)(‘花’, 58)(‘三’, 22)
62(‘ニット’, 26)(‘藍染’, 15)(‘グリーン’, 58)(‘天然’, 22)
63(‘限定’, 26)(‘剣道’, 15)(‘ブルー’, 55)(‘キー’, 21)
64(‘ヌビバッグ’, 26)(‘3’, 15)(‘R’, 55)(‘ナチュラル’, 21)
65(‘ブルー’, 25)(‘5’, 15)(‘両面’, 53)(‘手のひら’, 21)
66(‘持ち手’, 24)(‘前’, 15)(‘収納’, 52)(‘1’, 20)
67(‘ドット’, 24)(‘兼用’, 15)(‘レトロ’, 51)(‘PAC’, 20)
68(‘リバーシブル’, 24)(’20’, 15)(‘フラワー’, 51)(‘ポーチ’, 20)
69(‘ハワイアン’, 24)(‘セカンド’, 14)(‘1’, 50)(‘柄’, 19)
70(‘S’, 24)(‘新品’, 14)(‘編み’, 49)(‘クロム’, 18)
71(‘口’, 23)(‘ニュース’, 14)(‘限定’, 49)(‘シルバー’, 18)
72(‘ブラウン’, 23)(‘ペーパー’, 14)(‘値下げ’, 49)(‘真鍮’, 17)
73(‘B’, 23)(‘帯’, 14)(‘なつめ’, 49)(‘S’, 17)
74(‘まんまる’, 23)(‘グラス’, 14)(‘縦’, 49)(‘丘’, 17)
75(‘1’, 23)(‘L’, 14)(‘ラミネート’, 49)(‘染め’, 17)
76(‘値下げ’, 22)(‘エコ’, 14)(‘セット’, 48)(‘銭入れ’, 17)
77(‘丸底’, 21)(‘3’, 13)(‘タンバリン’, 43)(‘5’, 17)
78(‘編み’, 20)(‘点’, 13)(‘ビーズ’, 43)(‘レッド’, 16)
79(‘フリル’, 20)(‘グレー’, 13)(‘アクセサリー’, 43)(‘限定’, 16)
80(‘M’, 20)(‘迷彩’, 13)(‘バッグ’, 42)(‘たい焼き’, 16)
81(‘バルーン’, 20)(‘掛け紐’, 13)(‘点’, 41)(‘キャメル’, 15)
82(‘3’, 19)(‘cm’, 13)(‘ネックレス’, 41)(‘すべて’, 15)
83(‘両面’, 19)(‘二’, 12)(‘黒色’, 40)(‘ダン’, 15)
84(‘チューリップ’, 19)(‘M’, 12)(‘いちご’, 40)(‘ホルダー’, 15)
85(‘L’, 19)(‘ジーンズ’, 12)(‘パイソン’, 38)(‘半円’, 15)
86(‘和柄’, 18)(‘島紬’, 12)(‘タイプ’, 38)(‘WALLET’, 14)
87(‘ハンドル’, 18)(‘ヒッコリー’, 12)(‘ガーデン’, 38)(‘ジッパー’, 14)
88(‘2’, 18)(‘フラップ’, 12)(‘和柄’, 38)(‘エクセル’, 14)
89(‘ハロウィン’, 18)(’30’, 12)(‘薔薇’, 37)(‘ロープ’, 14)
90(‘プリント’, 18)(‘ヘラブナ’, 12)(‘古布’, 36)(’01’, 14)
91(‘キルト’, 18)(‘重’, 11)(‘容量’, 36)(‘送料’, 14)
92(‘モリス’, 18)(‘ワン’, 11)(‘スリム’, 35)(‘薄型’, 14)
93(‘特大’, 18)(‘財布’, 11)(‘栃木’, 35)(‘札’, 14)
94(‘run’, 18)(‘ネイビー’, 11)(‘デザイン’, 34)(’21’, 14)
95(‘袋’, 17)(‘フェイス’, 11)(‘ショルダー’, 33)(‘ネイビー’, 13)
96(‘赤’, 17)(‘紬’, 11)(‘グレー’, 33)(‘ブルー’, 13)
97(‘ワン’, 17)(’21’, 10)(‘サイズ’, 33)(‘925’, 13)
98(’11’, 17)(‘物入れ’, 10)(‘ランド’, 33)(‘モノトーン’, 13)
99(‘グラ’, 17)(‘朱印’, 10)(‘キー’, 33)(‘パターン’, 13)
100(‘ニー’, 17)(‘肩掛け’, 10)(‘モリス’, 33)(‘クロコダイル’, 12)
※数字は出現回数

考察

はい、集計結果が出そろいました。これらを眺めているだけで面白い発見がたくさんありますね~!ディープラーニング的な高度に相関関係の発見みたいな事までやらなくても、googleスプレットシートで商品データを集計する程度で十分な知見が得られそうです。

ただし、ここで行う考察は「メルカリ > ハンドメイド > バック、財布 > 男性、女性」という限定的なカテゴリの話だという事を念頭において読み進めて下さい。

男女別の市場規模

女性用のバッグ・財布の件数を合計すると18,984件、に対して男性用のバッグ・財布の合計件数は8,545件で、比較すると男性用よりも女性用の方が2.2倍ハンドメイド商品の販売数が多いと言えます。

金額の方を見てみると女性用の合計が54,452,281円、男性用の合計が51,549,347円となっていて全体金額としてはほぼ差がありませんでした。

女性用は販売点数が多く、男性用は販売単価が高いと考えられますね。

男女別購買行動の特徴

集計結果を眺めているとSOLD/売れ残りの平均金額に男女で差が出ている事に気付きました、女性はSOLDも売れ残りも金額にほぼ差はありませんが、男性はバック・財布共に金額に1.7倍程度の差が観測できました

この結果から購入の意思決定において女性よりも男性の方が金額的要素が強く働いているように見えます、つまり男物は適正金額で販売しておけば比較的売れやすく女性の場合は適正価格プラスアルファの部分がないと買ってくれないと言えるのかも。

女性用のバッグは売れにくく単価も低い!

この分析・考察を行う前に、僕が一番売れそうだと思って集中的に作っていたのが女性向けバックでした笑、データ分析ってほんとに大事ですね、大失敗する前に気付いてよかったです|д゚)

ただし女性用バッグが絶対稼げないと言っているわけではなく、他のカテゴリと比べて比較的参入障壁が高いんじゃないか、という認識です。初心者で男の自分にはまだ早いジャンルだと考えています。

女性用の財布が一番売れやすい!

女性用財布はSOLD率45%を誇る激熱カテゴリでした、売りに出したハンドメイド作品の約半分が売れる購買意欲の高いカテゴリなので知識・技術さえあれば参入しない理由はないです!

さらにトリミングした件数(=特定客との個別受注件数)も飛びぬけて多く、オーダーによる注文も活発に行われている事が予想されます。売れやすくファンも付きやすい理想的なカテゴリと言えるんじゃないでしょうか。

男性用の財布が一番儲かりやすい!

取引効率という観点で見てみると男性用財布が一歩抜きんでています。他のカテゴリと比較して平均の販売単価が約1.5倍あり、値段が高くても比較的売れるカテゴリであると言えます。

全体の金額や売れ残りの金額も一番高く、男性用の財布はかなり強気な価格設定にしていると言えそうです。恐らくは女性よりも男性の方が財布のひもが緩く、価格が高くても欲しい物であれば買ってくれるという事なんでしょうかね。

各カテゴリの売れる金額帯はここだ!

各カテゴリのヒストグラムから一番売れやすい販売金額のボリュームゾーンを抜き出してまとめてみました。

カテゴリ金額区分全体SOLD販売率
バック(女性用)3000-3500円648件173件26.7%
バック(男性用)3000-3500円144件58件40.3%
財布(女性用)3000-3500円764件483件63.2%
財布(男性用)5000-6000円262件107件40.8%

男性用財布以外のカテゴリは3,000-3,500円の範囲が一番購入率が高く、男性用財布のみ5,000-6,000円と倍近い金額がボリュームゾーンとなりました。

ただ男性用財布は他のカテゴリと比較して販売金額がまんべんなく高かったので、500円刻みではなく1,000円刻みでヒストグラムを集計しています。印象操作とかではなく単純にグラフが3倍くらいの長さになっちゃったので、縮めるために金額区分の粒度を荒くした感じです。

各ボリュームゾーンを見ると女性用財布の63.2%のSOLD率が圧倒的ですね、渋いと言われるメルカリでも範囲を絞って検証すれば美味しい販売条件が見つかるもんですね(‘ω’)

頻出キーワードを読み解く

これはめちゃくちゃ勉強になりました、メルカリのUIアルゴリズム的に自分の好きな物がトップに表示されるので包括的データで調べないとほとんど気付けなかったと思います。

素材:女性はブランド生地が好き、男性は革が好き

女性用バッグ・財布ともにブランド生地の名称である「リバティ」「ミナペルホネン」「ロラライハリス」「コヤンイサムチョン」などいくつかランクインしているのが観測できました。

一方で男性用バッグ・財布にはこれらのブランド生地は一切出て来ず「レザー」のキーワードがランクイン、次点で帆布やデニムも観測できました。同じように女性用バッグには「レザー」が一切出て来ず、この結果から男女別に好みの素材がはっきり分かれる結果となりました。

僕は本革で女性用バッグを集中的に作っていたので、一番見込み客の少ない場所で戦おうとしていたという事がはっきりと判明しました笑

素材:バッグは男女ともにリメイクが人気

メルカリデータを分析するまで「リメイク」というキーワードすら知りませんでした笑、いくつか人気のパターンがあるようで「デニム」「着物」「帯」をトートバッグに仕立てた作品が人気のようです。

ですが、古着を安価に安定仕入れできる伝手が必須のアイテムなので、今の僕には参入できそうにないジャンルですね。残念です((+_+))

「バック」じゃなくて「バッグ」

言い換え的なキーワードって意外と集客で大事なんですが、僕はずっと「バック」って書いてたんです。キーワードランキングには「バッグ」の方が7倍くらい多く使われていたので、検索するユーザー側も「バッグ」で検索する人が7倍くらい多いと考えていいんじゃないですかね。

デザイン:バッグはトートかショルダーが男女問わず人気

バッグのデザインはトートバッグかショルダーバッグの2強ですね、ちょっと離れて次点でポーチ・巾着といった所でしょうか。

男女同じデザインが人気なので素材で違いを出している感じで、ブランド生地で作れば女性用・レザーで作れば男性用と個性を出しているようでした。

デザイン:財布は男女別に特徴あり、L字ファスナー/がま口/二つ折りが人気

財布はデザインによって男女の好みがはっきり分かれているようで、

  • 男女どちらも人気:L字ファスナー
  • 女性に人気:がま口
  • 男性に人気:二つ折り、トラッカーウォレット

といった感じでした。技術の習得と言う意味では男女共に汎用的に売れる「L字ファスナー」からチャレンジしてみるといいかも。個人的はトラッカーウォレットを作ってみたいですが、商売的には女性用のがま口が結構バカ売れなので避けては通れないですね。

結論:ハンドメイドのバック・財布で稼ぐポイント

うーん色々と分かってきました、少なくとも僕が今注力していた「女性用バッグ」作りを止めて「女性用財布」「男性用財布」作りにシフトしようと思います。

仮に月間100アイテム作るとして、「女性用バック」と「女性用財布」をシミュレーションすると、

SOLD率平均単価個数売上
バック(女性用)19%2,90410055,176
財布(女性用)45%2,929100131,464

となり、おおよそ売上が2.4倍に!なるかもしれません笑、これまでの考察をベースに売上を2.4倍に上げるための具体的な施策は下記の通り。

男性用バックは帆布ベースのトートバッグを500-4,000円で売る

デニム生地やショルダーバッグもおなじくらい人気なんですが、デニムベースは生地から作った物よりもポケット部分や刺繍部分を活かしたリメイク品が人気で、仕入れ値が高そうですし作るのにセンスや技術が必要な気がします。

一方帆布のトートバックは生地も手に入りやすく、デザインや製作工程もシンプルで僕の今の技術で十分なクオリティが出せそうです。持ち手や底部に得意の本革を使えば類似品との差別化も出せそうなので、十分に戦えると思います。

女性用財布は「がま口」を作っておけば間違いない

がま口って人気なんですね~これは分かりませんでした。人気の素材は大きく2種類あるようでブランド生地で作った布製のがま口と、柔らかめのオイルレザーを使った本革のがま口が非常に良く売れています。

ブランド生地製は4,000円前後本革製は7,000円前後で取引されているようでブランド生地と本革の仕入れ価格が正しく売値に反映されている気がします。

本革を割安な半裁(250DS程度)で買うと安くても20,000円~はしますが、リバティ生地は新作でも400円前後(100㎝×10㎝程度)で買えるので、革と同じ250DS分買ったとしても10,000円と本革の半額程度の原価で済みます

ブランド生地製・本革製いずれも良く売れているので、僕は得意な革製のがま口を作ってみようと思います。

男性用財布は本革でL字ファスナーかトラッカーを作って2,000-9,000円で売る

コインケースも良く売れているんですが馬蹄型やウェットフォーミングなど、作るのに結構時間がかかる割には単価が安いです、買う分にはめっちゃお得と言えますね。また二つ折りや三つ折り財布も人気ですが、こっちもなぜか単価が安いので儲けるのは難しそうです。

対してL字ファスナー財布は構造も簡単で作りやすい割に販売単価が低くないです、素材やオプション・デザイン次第では5,000円前後でも安定して売れているっぽいですね。

トラッカーウォレットは多少制作難易度が上がりますが、販売単価は10,000円前後で取引されているアイテムも多く、素材と制作スピード・仕損次第で十分に利益が出せるかも。

データ収集に関する基準・技術的な話

この記事を読むハンドメイド作家さんには興味ないかもしれませんが、ここからはプログラムやらデータ収集・トリミングなど技術的なアイデアのお話です。

メルカリからデータを収集するには

メルカリは商品APIが一般公開されていないので頑張ってデータを集めました、今回は分析した結果の考察をメインに書きたいのでプログラミング / スクリプト的なお話は割愛します。

ただ「メルカリ スクレイピング」で上位表示される記事に掲載してある参考スクリプトが軒並み使えなくて、ちょっと苦労しましたが今でもデータの取得は可能でした。詳しく知りたい方は「お問い合わせ」から連絡下さい。

「ハンドメイド > ファッション/小物」カテゴリを分析

自分が作ったバックや財布を売りたいのが目的なので、今回はハンドメイドカテゴリー直下「ファッション/小物」カテゴリからバック・財布の商品データを根こそぎ集めました。

ファッション/小物は下記の下層の末端カテゴリを持っていて、

  • バック(女性用)
  • バック(男性用)
  • 財布(女性用)
  • 財布(男性用)
  • ファッション雑貨
  • その他

を包括しています。各カテゴリページは最大100ページ分しか商品データが表示されない仕様のため、例えば「ハンドメイド > すべて」でデータを収集すると10,000件分(約100アイテム/ページ×100ページ)しかハンドメイド関連の商品データが取得できないのに対し、上記6個の小カテゴリをそれぞれ指定してデータを取得するとMAX60,000件まで商品データを収集できます(1カテゴリ10,000件なので)。

ファッション雑貨・その他については中身が煩雑なので今回の分析/考察から除外しています。

データのトリミング

メルカリには「個別受注品確認用の専用商品ページ」という独自の文化がありまして、特定の顧客と個別の取引をする際に価格9,999,999円とか1,234,567円みたいな誰も買わないであろう条件で商品ページを作成し、個別注文客に商品の説明を行う事が黙認されています。

データ分析的に実態を伴わない商品データを取り除かないと分析結果がめちゃくちゃになっちゃうのでこういったデータは除外したいです。自動的に除去する条件を作りたいんですが、タイトルも金額もバラバラでルール化が面倒だったので4,000件くらい手作業で除去しました笑

ただ4万件くらいデータを眺めていて思ったのは、各出品者が独自ルールで複雑に商売を行っていて実態を伴うデータのみ抽出する事は到底不可能ですね笑、トリミングする事で精度は上がると思いますが全体像の把握程度に考えておいた方がいいのかも。

商品タイトルから頻出キーワード探し

商品タイトルから単語を抜き出して出現頻度で並び替えれば売れ筋アイテムが見つかるかなと思ったので、pythonのMeCabを使って頻出キーワードランキングを作ってみます。

MeCabじゃなくても形態素解析してくれるAPIがいくつもあるのでそっち使ってもいいんですが、たまたま僕の環境にMeCabが入っていたんで使っただけです。形態素解析できればなんでもいいです。

まとめ

メルカリデータ分析から得た知見はこんな感じになりましたが楽しめましたかね、ベテランの方々は知ってるわ!という内容も多かったと思いますが、メルカリ初心者の僕にとって脳みそが十分にスッキリする指針を得られました。

今回はメルカリのデータ収集スクリプトから作っていたので、この記事を書くのに1週間くらいかかっちゃいましたがツールや集計メソッドは出来上がったので、次回があれば別カテゴリの集計はすぐ出来るようになりました。

この記事が人気になればシリーズとしてメルカリの別カテゴリの分析もやってみようと思います。

この記事が面白かったらいいね、RTお願いしますm(_ _)m

個人開発プログラマーを応援するメンバーシップを始めました('ω')ノ

質問・要望・共同作業など、みんなのやりたい事をスマイルがお手伝いします。立ち上げたばかりでよく分かってないので、とりあえず何でもありやってみます。

コメント

  1. 和田 より:

    すごいアクティブに色んな事されるんですね。生きる力が凄いというか、才能に溢れてますね(^^

    • DIYプログラミング管理人 より:

      管理人のスマイルです(‘ω’)ノ

      飽き症で器用貧乏なんですよね~、好きな事ばっかりやっている内によく分からないスキル構成になってしまいました笑