プログラム&データの紹介
プログラム
Name | Entity Linker |
---|---|
Description | Entity Linkingと呼ばれる自然言語処理のタスクを文献情報に対して実行するガジェットです。Entity Linkingとは、テキストの中に含まれるキーワードと知識ベースに格納されているキーワードを紐付けることです。このガジェットに英語のテキスト(例:学術論文の要旨)を入力すると、その中に含まれるキーワードが知識ベースに格納されたキーワードと紐づけられた形で出力します。 |
Reference | http://prm-ezcatdb.cbrc.jp/entity_linking/ |
Institute | National Institute of Advanced Industrial Science and Technology (AIST) |
Contributors | Masami Ikeda & Hiroya Takamura |
Name | NamedEntityRecognizer |
---|---|
Description | Named Entity Recognition (固有表現認識)と呼ばれる自然言語処理のタスクを文献情報に対して実行するガジェットです。Named Entity Recognitionとは、テキストの中に含まれる病名、細胞名、薬理物質、といったキーワードを抽出・分類することです。このガジェットに英語のテキスト(例:学術論文の要旨)を入力すると、そのテキストの中からあらかじめ指定した37項目(病名、細胞名、薬理物質といった創薬分野において重要な固有名詞)に当てはまるキーワードを見つけ出します。 |
Reference | http://prm-ezcatdb.cbrc.jp/named_entity_recognition/ |
Institute | National Institute of Advanced Industrial Science and Technology (AIST) |
Contributors | Masami Ikeda & Hiroya Takamura |
Name | JaMIE |
---|---|
Description | relation extractionと呼ばれる自然言語処理のタスクを日本語の診療情報に対して実行するガジェットです。Relation extractionとは、テキストの中に含まれるキーワード間の意味関係を抽出することです。このガジェットに日本語の医療テキスト(例:CT画像の読影所見)を入力すると、その中に含まれるキーワードがどのキーワードとどのような関係性にあるのかを紐づけられた形で出力します。 |
Reference | https://github.com/racerandom/JaMIE |
Institute | Kyoto University |
Contributors | Fei Cheng & Sadao Kurohashi |
Name | Semantic Search |
---|---|
Description | 入力した電子カルテや読影所見などの医療文書に対し,類似する文書を提示する文書検索システムです。検索対象はPRISM事業でアノテーションが施された医療文書群となります。院内の既存症例検索といった適応が例として考えられます。 |
Reference | https://aoi.naist.jp/prism-search/ |
Institute | Nara Institute of Science and Technology (NAIST) |
Contributors |
Name | HeaRT |
---|---|
Description | 電子カルテや読影所見などの医療文書を入力すると,記載された医療情報が実際に記述された時系列に応じてガントチャートのような形式で図示します。チーム医療のためのコメディカル間情報共有の促進として利用できます。 |
Reference | https://aoi.naist.jp/prism-heart/ |
Institute | Nara Institute of Science and Technology (NAIST) |
Contributors |
Name | SFM, bST |
---|---|
Description | SFMEDM(Space-efficient feature maps for string alignment kernels)は、文字列のセットを入力すると、その特徴ベクトルのセットを出力します。SFMEDMで作成された特徴ベクトルを用いて、線形SVM(Support vector machine)により文字列の分類や回帰といった予測タスクを実行することができる様になります。例えば、アミノ酸配列を学習データに用いた予測タスクなどに有用です。文字列は非線形空間にマップされるためSFMEDMを使った予測性能は高精度である、一方、メモリー効率は高いです。 |
Reference | https://github.com/tb-yasu/SFMEDM https://github.com/kampersanda/integer_sketch_search |
Institute | RIKEN |
Contributors | Yasuo Tabei |
Name | kGCN Network Prediction |
---|---|
Description | グラフ畳み込みニューラルネットワーク(GCN)は、低分子化合物の構造情報をグラフとして入力することが可能であり、多くの種類の予測タスクで良好なパフォーマンスを示すと報告されています。kGCNはオープンソースのGCNツールで、予測モデル構築に必要な前処理、自動モデルチューニングのためのベイズ最適化、結果解釈のため予測への寄与が大きい原子の可視化といった機能を備えています。このガジェットは、予測に用いるデータセット、ノード、学習済みモデルを入力するとノード間に存在すると考えられる新たなリンクを予測・出力します。 |
Reference | https://github.com/clinfo/kGCN |
Institute | Kyoto University |
Contributors | Ryosuke Kojima & Yasushi Okuno |
Name | Molenc |
---|---|
Description | 化合物の情報を機械学習で用いるためのアプローチの一つに、その化合物に特定の部分構造がいくつあるかを示すベクトルで表すフィンガープリントがあります。フィンガープリントには様々な生成方法がありますが、このガジェットはJ.L.Faulonらが2003年に発表したSignature Molecular Descriptor(SMD)を生成します。このガジェットに興味のある化合物の構造情報(SMILES)リストを入力すると、特徴量(部分構造)の対応表とSMDフィンガープリントを出力します。既に特徴量の対応表が手元にある場合は、「encoding.dix」のチェックボックスにチェックを入れた状態で対応表をアップロードしてから実行ボタンを押してください。ない場合はチェックボックスのチェックを外してから実行ボタンを押してください。 |
Reference | https://github.com/UnixJunkie/molenc |
Institute | Kyushu Institute of Technology |
Contributors | Francois Berenger & Yoshihiro Yamanishi |
Name | Vanishing Ranking Kernels |
---|---|
Description | ある化合物群について活性の強さの分類モデルを学習し、活性未知の化合物群に対して予測することで、リガンドベースの仮想スクリーニングを行います。Vanishing kernelと分子間のTaminoto係数をもとに学習を行います。作成されたモデルには活性に関する適用範囲(Applicability Domain、AD)が定義されます。このADを利用することで、スクリーニング効率を向上させます。 入力ファイルは、化合物の構造ではなく、feature(記述子)となります。 詳細は https://github.com/UnixJunkie/rankers を参照願います。 |
Reference | https://github.com/UnixJunkie/rankers |
Institute | Kyushu Institute of Technology |
Contributors | Francois Berenger & Yoshihiro Yamanishi |
Name | Modified Diet Networks |
---|---|
Description | ゲノムデータのように超高次元(n << p)のデータでは、正則化などの工夫をしても過学習を避けるのが難しいという問題があります。Diet Networksはそのような超高次元データを学習に用いることを想定したディープラーニングの手法です。Modified Diet Networksは、安定して高精度の予測ができるように改良されたDiet Networksです。このガジェットには、Modified Diet Networksにより肺がん患者の体細胞変異プロファイルから肺腺癌(LUAD)と肺扁平上皮癌(LUSC)の分類を行う学習済みモデルが搭載されています。患者の体細胞変異プロファイル情報(各遺伝子に幾つの体細胞変異があるかをカウントしたベクトル/1患者。複数人分を行列として入力することもできます)を入力すると、その患者がLUADかLUSCかを予測した結果を出力します。 |
Reference | https://www.mdpi.com/2218-273X/10/9/1249 |
Institute | National Cancer Center |
Contributors | Ken Asada & Ryuji Hamamoto |
Name | Multiomics Analyzer |
---|---|
Description | 近年、マルチオミックスデータ解析は様々な用途で注目されていますが、その方法論はまだ十分に確立されていません。オミックスデータ解析における一番の課題の一つは、「高次元データをどのように扱うか」です。Multiomics_Analyzerは、TCGA(The Cancer Genome Atlas)の肺がん患者から取得したmiRNA・mRNAデータに対して教師なし深層学習の手法であるオートエンコーダを適用・学習したモデルを搭載しています。miRNA・mRNAのデータを入力すると、次元を削減した特徴ベクトルを出力します。ここで得られた特徴ベクトルを用いて、分類や回帰などの予測タスクを実行することができます。 |
Reference | https://www.mdpi.com/2218-273X/10/4/524/htm |
Institute | National Cancer Center |
Contributors | Kazuma Kobayashi & Ryuji Hamamoto |
Name | Subset Binder |
---|---|
Description | このガジェットは、subset bindingというアルゴリズムを用いて2つのデータ間を跨いで連関のある項目のグループを見つけ出します。例えば、診療情報とオミックスデータを入力すると、一緒に変動する分子群と、それに連動して変化する診療情報の項目群をペアにして出力します。峰では、動作確認用データとして高濃度アセトアミノフェンをラットに投与した際の肝毒性を反映する2種類のデータ(肝毒性の表現型データと遺伝子発現プロファイル)を搭載しています。これらを入力すると、肝毒性に関する表現型の項目グループと連動して変化する遺伝子グループが出力されます。Subset bindingはassociation rule miningの技術を基盤とするため、用いられているパラメーターは一般的にassociation rule miningで使用されるものと定義は同じです。 |
Reference | https://www.researchsquare.com/article/rs-405195/latest.pdf |
Institute | National Institutes of Biomedical Innovation, Health and Nutrition (NIBIOHN) & RIKEN |
Contributors | Yayoi Natsume-Kitatani & Naonori Ueda |
Name | RPPA |
---|---|
Description | Deep Autoencoderを利用した肺扁平上皮癌と肺腺 癌の予後予測システムです。逆相タンパク質アレイ(RPPA)データのみで、6種類のomics データ (RNA sequencing data、miRNA sequencing data、DNA methylation data、copy number variation、somatic mutation DNA、sequencing data、RPPA data)を用いた場合と同等の予後予測が可能です。 |
Reference | https://www.mdpi.com/2218-273X/10/10/1460 |
Institute | National Cancer Center |
Contributors | Ken Asada, Ryuji Hamamoto |
Name | PathoGN |
---|---|
Description | 変異情報、遺伝子関係のネットワークを入力すると、変異の病原性および生体分子ネットワーク上に存在している予測に関連した遺伝子などを提示します。kGCNの機能拡張として実装された新規手法です。 |
Reference | |
Institute | Kyoto University |
Contributors | Ryosuke Kojima, Yasushi Okuno |
Name | INGOR |
---|---|
Description | ベイジアンネットワーク推定アルゴリズムの実装です。計測した生体分子プロファイルを入力すると、遺伝子や蛋白質といった生体分子間因果ネットワークを作成します。 分子間制御因果メカニズム解明や、新規薬剤ター ゲット候補探索に利用可能です。 |
Reference | https://ytlab.jp/clinfo/ingor/tutorialja.html |
Institute | Kyoto University |
Contributors | Yoshinori Tamada, Yasushi Okuno |
Name | INGOR ECv |
---|---|
Description | 計測した生体分子プロファイルとINGORで 推定したベイジアンネットワークを入力すると、ネットワーク中の各枝に対する貢献量 (ECv: Edge Contribution value)、とそれを用いて抽出した部分ネットワークを出力します。 学術利用のみです。 |
Reference | https://doi.org/10.1038/s41598-021-02394-w |
Institute | Kyoto University |
Contributors | Nakazawa, M.A., Tamada, Y., Tanaka, Y., Ikeguchi, M., Higashihara, K., Okuno, Y. |
Name | INGOR RC |
---|---|
Description | 計測した生体分子プロファイルとINGORで推定したベイジアンネットワークを入力すると、
サンプルごとのネットワーク可視化のために必要な各枝に対する貢献量相対値 (RC : Relative Contribution value)が出力されます。 学術利用のみです。 |
Reference | https://doi.org/10.1038/s41598-021-90556-1 |
Institute | Kyoto University |
Contributors | Tanaka, Y., Higashihara, K., Nakazawa, M.A., Yamashita, F., Tamada, Y., Okuno, Y. |
Name | INGOR Network |
---|---|
Description | 計測した生体分子プロファイルから、ベイジアンネットワーク推定アルゴリズムにより遺伝子や蛋白質といった生体分子間因果ネットワーク、ECvおよびネットワークに基づくサンプルの層別化やグループ化の結果を提示します。
分子間制御因果メカニズム解明、新規薬剤ターゲット候補探索や患者層別化に活用することができます。 学術利用のみです。 |
Reference | |
Institute | Kyoto University |
Contributors | Yoshinori Tamada, Yasushi Okuno |
Name | TargetMine |
---|---|
Description | 創薬の初期研究における支援(特にターゲット探索など)を目的として、国際的に広く使用されている 30 以上の公共のデータソースを統合し、効率的な知識発見を可能にしたデータウェアハウス。遺伝子、タンパク質、パスウェイから、3D構造、化合物との相互作用まで様々なデータが網羅する。今のところ,TargetMineに取り込んでいるデータは,主に創薬分野で最も研究されたモデル生物である人(human),ラット(rat),及びマウス(mouse)に絞り込んでいます。 |
Reference | https://doi.org/10.1093/bioinformatics/btac507 |
Institute | National Institutes of Biomedical Innovation, Health and Nutrition (NIBIOHN) |
Contributors | Yi-An Chen, Kenji Mizuguchi |