[Python] 基礎-6 csvファイルの読み込み

1.一般的な流れ

(1) “csv”モジュールを使った読み込み
“csv”モジュールをインポート import csv
open関数を使ってcsvファイルオブジェクト(csv_obj)を生成
csv_obj.reader ⇒ 行単位(iteratorプロトコル対応)オブジェクトをリスト形式で生成
csv_obj.DictReader ⇒ 行単位(iteratorプロトコル対応)オブジェクトを辞書形式で生成

(2) “panda”モジュールを使った読み込み
“panda”モジュールをインポート import pandas
データ分析用のモジュール・・・いつか使ってみたい

2.”csv”モジュールを使った読み込み

open関数

使い方の例:

with open(path+’\’+csv_A, mode=’r’, encoding=’utf_8′) as csv_obj:

引数     説明
mode“r”: read only
“w”: 書き込み許可
“x”: 排他的。
“a”:ファイルがあるときは追記
encoding 文字コード
 ”utf-8″:日本語
newlineex.: None, ”, ‘\n’, ‘\r’, ‘\r\n’

reader

使い方の例:

with open(ファイル名, mode=’r’, encoding=’utf_8′) as csv_obj:
csv_reader = csv.reader(csv_obj)
header = next(csv_reader)
print(header) 👈 headerはリスト
for row in csv_reader:
print(row[0]) 👈 rowはリスト

[Python] 出願人名の名寄せ

〘 課題 〙

「名寄せ」とは、表記を一つにまとめること。出願人名は、企業、団体、学校、研究機関、個人などの名称で、主体が同じでも完全に統一されていて変更されないというわけではない。例えば、会社名の変更、合併などで名称が変更されることがある。それ以外にも、関連会社などので1つのグループとして扱った方が良い場合もある。

〘 仕様 〙

処理対象:EXCELの特許文献リスト(「”db”シート」とする)
     「csvの前処理」を使って抽出した「筆頭出願人」カラムを持つことを想定
入力:「筆頭出願人」カラム
出力:「筆頭出願人(名寄せ)」カラム
「名寄せ」シート: 「筆頭出願人」と「筆頭出願人(名寄せ)」の対応付け

〘 名寄せシートの作り方 〙

「”db”シート」から「筆頭出願人」のピボットテーブルを作成

EXCELの「ピボットテーブル」を使うのは必須ではないが、出願件数の多い「筆頭出願人」を優先して、どのような名称を名寄せするかを検討する。
これをコピーして「名寄せ」シートを作成

名寄せ前の出願人名(Aカラム)を名寄せ後の出願人名(Bカラム)に対応付ける作業
出願件数の多い出願人名を優先して行い、上位何社(何人)まで行うかは、分析の目的による。

上の「パナソニックGr.」のように、「三洋電機」との合併、「松下電器産業」からの社名変更、「パナソニックIPマネージメント株式会社」などの関連会社など、まとめて扱いたいグループごとに、名寄せ後の出願人名を統一する。

名寄せ辞書の作成も、AIを活用するなどで自動化したいが、まだまだ検討中……
現段階では、マニュアルで進めるしかない。

〘 pythonによる処理 〙

〘 プログラムのポイント 〙

① 「名寄せ」シートを参照して、「名寄せ辞書」”name_dictionary”を作成。
   キー:元の出願人名
   値:名寄せ後の名称(空欄なら値は”None”)
   (「辞書」については、 基礎-2 リスト、タプル、辞書 を参照。)

② ”db”シートの各行(各特許文献)について、「筆頭出願人」が「名寄せ辞書」のキーのどれかに一致するので、値があればその値(名寄せ後の出願人名)、値がなければ(None)「筆頭出願人名」をそのまま、「筆頭出願人(名寄せ)」のカラムに出力する。

〘 処理結果 〙

出願人名を名寄せした後で、もう一度ピボットテーブルを作ると、出願人グループごとに出願件数を集計することができる。

特許マップDIYサポートキャンペーン 第3回

外出自粛/在宅勤務 応援企画

特許マップDo It Yourself
サポートキャンペーン 第3回

(緊急事態宣言期間中無料)

緊急事態宣言が、昨年4月、今年1月に続き三度発出されてしまいました。特許マップDIYサポートの無料サービスキャンペーンも、このたびもう一度行うことにしました。この災禍を福に転じたいと願っております。

かねがね、特許マップを自分で作ってみたいと思っていた方、チャレンジしてみませんか?
新型コロナウィルスの脅威はありますが、まとまった時間がとれる機会は増えているのではないでしょうか? 

    • ・検索式作成 相談、代行
    • ・ヒット文献集合csvダウンロード
    • ・Excel(関数/ピボット/マクロ)操作 

特許マップを作るには、まず目的に合った特許文献集合を作る必要があります。是非、この機会にご相談ください。弁理士の職業的守秘義務の範囲です。業務上のテーマについてもご相談いただけます。

商用の検索データベースを利用できない方には、作成した文献集合をcsvダウンロードして無償提供します。

Excel(関数/ピボット/マクロ)については、セミナーのプレゼン資料(Seminar-PatentSearch-and-Map_20190703)か拙著を参考に進めてください。こみ入った内容のご質問にはSkype, ZoomなどのWeb会議システムで対応いたします。Excelシート画面を共有しながらQ&Aできますので。

メール(mail to: kojima#aq-patent.com 注:「#」を「@」に代えてください)でお申し込みください。

中国が注力するSMICの特許戦略を探ってみた[中国半導体関連特許Ⅵ]

 最近の報道(下)からは、中国は半導体の国産化を進める政策で、SMIC(中芯国際)を最重要視しているように見える。
 「中国SMICと政府系ファンド、7900億円で新工場建設: 日本経済新聞 (nikkei.com)」(2020/12/4付け日経電子版)

 また、「中国、半導体産業育成へ 有力企業に支援集中」(出所:2021.3.12付け日本経済新聞電子版 https://www.nikkei.com/article/DGXZQOGM189JJ0Y1A210C2000000/)では、「SMICは政府系ファンドなどの支援を受け、生産能力を高めている。」また、「工業情報化省によると、20年の半導体産業の売上高は8848億元で前年に比べ17%増えた。中国の半導体受託生産最大手、中芯国際集成電路製造(SMIC)の20年12月期の純利益は7億1600万ドル(約760億円)で、前期の約3倍に増えた。堅調な国内需要に支えられ、売上高が前期比25%増の39億ドルに拡大した。」と、報道された。

 これに対して、紫光集団については、債務不履行が続いていると報じられている。

紫光集団、債務不履行でも操業続く 中国政府が後ろ盾」(出所:2021.1.13付け日本経済新聞電子版 https://www.nikkei.com/article/DGXZQOGM1680A0W0A211C2000000/
「中国を代表する半導体大手、紫光集団が債務危機に揺れている。2020年末までに4度の社債の債務不履行を起こす一方、傘下企業は操業を続けている。その背後には政府資本が複雑に入り込む中国独特の企業統治の仕組みと、22年の共産党大会を控えた政治情勢が見え隠れする。」

 一方、「半導体製造(H01L 21)[中国の半導体関連特許Ⅱ]」2019.11.11報告では、国際特許分類(IPC)がH01L 21/00(半導体製造)に分類される中国特許について、以下のように分析し、SMIC(中芯国際)については、「中国最大のファブ300φウエハファブを持ち、14nmの微細加工技術も持っているが、2015年から出願件数を急減させている」と分析した(下図)。

今回の事例研究では、そんなSMIC(中芯国際)に着目して、その特許戦略を探ってみた。

〔SMIC(中芯国際)とは〕

とは、

中国語:中芯国际集成电路制造有限公司
英語:    Semiconductor Manufacturing
    International Corporation

SMICのホームページ(https://www.smics.com/jp/site/company_info#page_slide_0)によると、『2000年に設立されたSMICは、世界有数のファウンドリであり、中国本土で最も先進的で最大のファウンドリであり、技術範囲が最も広く、半導体製造サービスが最も包括的であり、集積回路(IC)を提供します。 ロジック、ミックスドシグナル/ RF、CMOS、高電圧、SoC、フラッシュ、EEPROM、CIS、電力管理IC、MEMSなどの機能を備えた、0.35μmから14nmまでの幅広いノード向けのファウンドリおよびテクノロジーサービス。』

〔出願している特許の技術分野を探ってみた〕

特許出願の技術分野を、筆頭IPC(国際特許分類)で分類した。

やはり、半導体(H01L)が大半の70%。

〔外国出願動向を探ってみた〕

ほとんどが、中国の国内出願のみ。外国出願はあっても米国(US)のみ。

しかも、中国製造2025が打ち出された2015年以降の特許出願件数は急減中。

どうも、中央政府の掛け声や投資の集め方と、特許出願動向は、連動していないように見える。

J-Plat Patの機能改善 2021.2.1

J-Plat Patの機能改善が行われました。
202101_J-PlatPat_releasenotes.pdf (inpit.go.jp)

〔1〕特許・実用新案分類照会(PMGS)の簡易表示

特許・実用新案分類照会(PMGS)の簡易表示がリリースされ、階層構造が見やすくなりました。

スクロールせずに表示される階層構造の範囲がかなり広くなりなり、とてもわかりやすくなりました。

〔2〕CSV出力できる件数の上限=500件

一度にCSV出力できる件数の上限が100件でしたが、500件に増えました。

特許マップを作成するなど、特許情報を統計的に処理する元データにするには、500件でも少々もの足りない感じはしなくもありませんが、数回で2000件~3000件のデータを作成することができるので、大きな進歩です。是非活用して、特許マップを描いてみてください。