Repository: chiayewken/Span-ASTE Branch: main Commit: b252f8b1e402 Files: 22 Total size: 303.8 KB Directory structure: gitextract_j_aejt67/ ├── .gitignore ├── LICENSE ├── README.md ├── aste/ │ ├── __init__.py │ ├── analysis.py │ ├── data_utils.py │ ├── utils.py │ └── wrapper.py ├── demo.ipynb ├── requirements.txt ├── sample_data.txt ├── setup.sh ├── span_model/ │ ├── __init__.py │ ├── data/ │ │ ├── __init__.py │ │ └── dataset_readers/ │ │ ├── document.py │ │ └── span_model.py │ ├── predictors/ │ │ ├── __init__.py │ │ └── span_model.py │ └── training/ │ ├── f1.py │ ├── ner_metrics.py │ └── relation_metrics.py └── training_config/ └── config.jsonnet ================================================ FILE CONTENTS ================================================ ================================================ FILE: .gitignore ================================================ *__pycache__ *.pyc *.log *.csv *.swp tags punkt.zip wordnet.zip .idea/ aste/data/ models/ model_outputs/ outputs/ ================================================ FILE: LICENSE ================================================ MIT License Copyright (c) 2022 Chia Yew Ken Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions: The above copyright notice and this permission notice shall be included in all copies or substantial portions of the Software. THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE. ================================================ FILE: README.md ================================================ ## Span-ASTE: Learning Span-Level Interactions for Aspect Sentiment Triplet Extraction **\*\*\*\*\* New August 30th, 2022: Featured on YouTube video by Xiaoqing Wan [![YT](https://img.shields.io/youtube/views/rRTvsuGRnJ0?style=social)](https://www.youtube.com/watch?v=rRTvsuGRnJ0) \*\*\*\*\*** **\*\*\*\*\* New March 31th, 2022: Scikit-Style API for Easy Usage \*\*\*\*\*** [![PWC](https://img.shields.io/badge/PapersWithCode-Benchmark-%232cafb1)](https://paperswithcode.com/sota/aspect-sentiment-triplet-extraction-on-aste) [![Colab](https://img.shields.io/badge/Colab-Code%20Demo-%23fe9f00)](https://colab.research.google.com/drive/1F9zW_nVkwfwIVXTOA_juFDrlPz5TLjpK?usp=sharing) [![Jupyter](https://img.shields.io/badge/Jupyter-Notebook%20Demo-important)](https://github.com/chiayewken/Span-ASTE/blob/main/demo.ipynb) This repository implements our ACL 2021 research paper [Learning Span-Level Interactions for Aspect Sentiment Triplet Extraction](https://aclanthology.org/2021.acl-long.367/). Our goal is to extract sentiment triplets of the format `(aspect target, opinion expression and sentiment polarity)`, as shown in the diagram below.

### Installation - Tested on Python 3.7 (recommended to use a virtual environment such as [Conda](https://docs.conda.io/en/latest/miniconda.html)) - Install data and requirements: `bash setup.sh` - Training config: [training_config/config.jsonnet](training_config/config.jsonnet) - Modeling code: [span_model/models/span_model.py](span_model/models/span_model.py) ### Data Format Our span-based model uses data files where the format for each line contains one input sentence and a list of output triplets. The following data format is demonstrated in the [sample data file](sample_data.txt): > sentence#### #### ####[triplet_0, ..., triplet_n] Each triplet is a tuple that consists of `(span_a, span_b, label)`. Each span is a list. If the span covers a single word, the list will contain only the word index. If the span covers multiple words, the list will contain the index of the first word and last word. For example: > It also has lots of other Korean dishes that are affordable and just as yummy .#### #### ####[([6, 7], [10], 'POS'), ([6, 7], [14], 'POS')] For prediction, the data can contain the input sentence only, with an empty list for triplets: > sentence#### #### ####[] ### Predict Using Model Weights - First, download and extract [pre-trained weights](https://github.com/chiayewken/Span-ASTE/releases) to `pretrained_dir` - The input data file `path_in` and output data file `path_out` have the same [data format](#data-format). ``` from wrapper import SpanModel model = SpanModel(save_dir=pretrained_dir, random_seed=0) model.predict(path_in, path_out) ``` ### Model Training - Configure the model with save directory and random seed. - Start training based on the training and validation data which have the same [data format](#data-format). ``` model = SpanModel(save_dir=save_dir, random_seed=random_seed) model.fit(path_train, path_dev) ``` - To train with multiple random seeds from the command-line, you can use the following command: - Replace `14lap` for other datasets (eg `14res`, `15res`, `16res`) ``` python aste/wrapper.py run_train_many \ --save_dir_template "outputs/14lap/seed_{}" \ --random_seeds [0,1,2,3,4] \ --path_train data/triplet_data/14lap/train.txt \ --path_dev data/triplet_data/14lap/dev.txt ``` ### Model Evaluation - From the trained model, predict triplets from the test sentences and output into `path_pred`. - The model includes a scoring function which will provide F1 metric scores for triplet extraction. ``` model.predict(path_in=path_test, path_out=path_pred) results = model.score(path_pred, path_test) ``` - To evaluate with multiple random seeds from the command-line, you can use the following command: - Replace `14lap` for other datasets (eg `14res`, `15res`, `16res`) ``` python aste/wrapper.py run_eval_many \ --save_dir_template "outputs/14lap/seed_{}" \ --random_seeds [0,1,2,3,4] \ --path_test data/triplet_data/14lap/test.txt ``` - To run scoring on your own prediction file from command-line, you can use the following command: - Replace `14lap` for other datasets (eg `14res`, `15res`, `16res`) ``` python aste/wrapper.py run_score --path_pred your_file --path_gold data/triplet_data/14lap/test.txt ``` ### Research Citation If the code is useful for your research project, we appreciate if you cite the following paper: ``` @inproceedings{xu-etal-2021-learning, title = "Learning Span-Level Interactions for Aspect Sentiment Triplet Extraction", author = "Xu, Lu and Chia, Yew Ken and Bing, Lidong", booktitle = "Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)", month = aug, year = "2021", address = "Online", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2021.acl-long.367", doi = "10.18653/v1/2021.acl-long.367", pages = "4755--4766", abstract = "Aspect Sentiment Triplet Extraction (ASTE) is the most recent subtask of ABSA which outputs triplets of an aspect target, its associated sentiment, and the corresponding opinion term. Recent models perform the triplet extraction in an end-to-end manner but heavily rely on the interactions between each target word and opinion word. Thereby, they cannot perform well on targets and opinions which contain multiple words. Our proposed span-level approach explicitly considers the interaction between the whole spans of targets and opinions when predicting their sentiment relation. Thus, it can make predictions with the semantics of whole spans, ensuring better sentiment consistency. To ease the high computational cost caused by span enumeration, we propose a dual-channel span pruning strategy by incorporating supervision from the Aspect Term Extraction (ATE) and Opinion Term Extraction (OTE) tasks. This strategy not only improves computational efficiency but also distinguishes the opinion and target spans more properly. Our framework simultaneously achieves strong performance for the ASTE as well as ATE and OTE tasks. In particular, our analysis shows that our span-level approach achieves more significant improvements over the baselines on triplets with multi-word targets or opinions.", } ``` ================================================ FILE: aste/__init__.py ================================================ ================================================ FILE: aste/analysis.py ================================================ import json import random import sys from pathlib import Path from typing import List import _jsonnet import numpy as np import torch from allennlp.commands.train import train_model from allennlp.common import Params from allennlp.data import DatasetReader, Vocabulary, DataLoader from allennlp.models import Model from allennlp.training import Trainer from fire import Fire from tqdm import tqdm from data_utils import Data, Sentence from wrapper import SpanModel, safe_divide def set_seed(seed: int): random.seed(seed) np.random.seed(seed) torch.manual_seed(seed) def test_load( path: str = "training_config/config.jsonnet", path_train: str = "outputs/14lap/seed_0/temp_data/train.json", path_dev: str = "outputs/14lap/seed_0/temp_data/validation.json", save_dir="outputs/temp", ): # Register custom modules sys.path.append(".") from span_model.data.dataset_readers.span_model import SpanModelReader assert SpanModelReader is not None params = Params.from_file( path, params_overrides=dict( train_data_path=path_train, validation_data_path=path_dev, test_data_path=path_dev, ), ) train_model(params, serialization_dir=save_dir, force=True) breakpoint() config = json.loads(_jsonnet.evaluate_file(path)) set_seed(config["random_seed"]) reader = DatasetReader.from_params(Params(config["dataset_reader"])) data_train = reader.read(path_train) data_dev = reader.read(path_dev) vocab = Vocabulary.from_instances(data_train + data_dev) model = Model.from_params(Params(config["model"]), vocab=vocab) data_train.index_with(vocab) data_dev.index_with(vocab) trainer = Trainer.from_params( Params(config["trainer"]), model=model, data_loader=DataLoader.from_params( Params(config["data_loader"]), dataset=data_train ), validation_data_loader=DataLoader.from_params( Params(config["data_loader"]), dataset=data_dev ), serialization_dir=save_dir, ) breakpoint() trainer.train() breakpoint() class Scorer: name: str = "" def run(self, path_pred: str, path_gold: str) -> dict: pred = Data.load_from_full_path(path_pred) gold = Data.load_from_full_path(path_gold) assert pred.sentences is not None assert gold.sentences is not None assert len(pred.sentences) == len(gold.sentences) num_pred = 0 num_gold = 0 num_correct = 0 for i in range(len(gold.sentences)): tuples_pred = self.make_tuples(pred.sentences[i]) tuples_gold = self.make_tuples(gold.sentences[i]) num_pred += len(tuples_pred) num_gold += len(tuples_gold) for p in tuples_pred: for g in tuples_gold: if p == g: num_correct += 1 precision = safe_divide(num_correct, num_pred) recall = safe_divide(num_correct, num_gold) info = dict( precision=precision, recall=recall, score=safe_divide(2 * precision * recall, precision + recall), ) return info def make_tuples(self, sent: Sentence) -> List[tuple]: raise NotImplementedError class SentimentTripletScorer(Scorer): name: str = "sentiment triplet" def make_tuples(self, sent: Sentence) -> List[tuple]: return [(t.o_start, t.o_end, t.t_start, t.t_end, t.label) for t in sent.triples] class TripletScorer(Scorer): name: str = "triplet" def make_tuples(self, sent: Sentence) -> List[tuple]: return [(t.o_start, t.o_end, t.t_start, t.t_end) for t in sent.triples] class OpinionScorer(Scorer): name: str = "opinion" def make_tuples(self, sent: Sentence) -> List[tuple]: return sorted(set((t.o_start, t.o_end) for t in sent.triples)) class TargetScorer(Scorer): name: str = "target" def make_tuples(self, sent: Sentence) -> List[tuple]: return sorted(set((t.t_start, t.t_end) for t in sent.triples)) class OrigScorer(Scorer): name: str = "orig" def make_tuples(self, sent: Sentence) -> List[tuple]: raise NotImplementedError def run(self, path_pred: str, path_gold: str) -> dict: model = SpanModel(save_dir="", random_seed=0) return model.score(path_pred, path_gold) def run_eval_domains( save_dir_template: str, path_test_template: str, random_seeds: List[int] = (0, 1, 2, 3, 4), domain_names: List[str] = ("hotel", "restaurant", "laptop"), ): print(locals()) all_results = {} for domain in domain_names: results = [] for seed in tqdm(random_seeds): model = SpanModel(save_dir=save_dir_template.format(seed), random_seed=0) path_pred = str(Path(model.save_dir, f"pred_{domain}.txt")) path_test = path_test_template.format(domain) if not Path(path_pred).exists(): model.predict(path_test, path_pred) results.append(model.score(path_pred, path_test)) precision = sum(r["precision"] for r in results) / len(random_seeds) recall = sum(r["recall"] for r in results) / len(random_seeds) score = safe_divide(2 * precision * recall, precision + recall) all_results[domain] = dict(p=precision, r=recall, f=score) for k, v in all_results.items(): print(k, v) def test_scorer(path_pred: str, path_gold: str): for scorer in [ OpinionScorer(), TargetScorer(), TripletScorer(), SentimentTripletScorer(), OrigScorer(), ]: print(scorer.name) print(scorer.run(path_pred, path_gold)) if __name__ == "__main__": Fire() ================================================ FILE: aste/data_utils.py ================================================ import ast import copy import json import os from collections import Counter from enum import Enum from pathlib import Path from typing import Dict, List, Optional, Set, Tuple import numpy as np import pandas as pd from fire import Fire from pydantic import BaseModel from sklearn.metrics import classification_report from utils import count_joins, get_simple_stats RawTriple = Tuple[List[int], int, int, int, int] Span = Tuple[int, int] class SplitEnum(str, Enum): train = "train" dev = "dev" test = "test" class LabelEnum(str, Enum): positive = "POS" negative = "NEG" neutral = "NEU" opinion = "OPINION" target = "TARGET" @classmethod def as_list(cls): return [cls.neutral, cls.positive, cls.negative] @classmethod def i_to_label(cls, i: int): return cls.as_list()[i] @classmethod def label_to_i(cls, label) -> int: return cls.as_list().index(label) class SentimentTriple(BaseModel): o_start: int o_end: int t_start: int t_end: int label: LabelEnum @classmethod def make_dummy(cls): return cls(o_start=0, o_end=0, t_start=0, t_end=0, label=LabelEnum.neutral) @property def opinion(self) -> Tuple[int, int]: return self.o_start, self.o_end @property def target(self) -> Tuple[int, int]: return self.t_start, self.t_end @classmethod def from_raw_triple(cls, x: RawTriple): (o_start, o_end), polarity, direction, gap_a, gap_b = x # Refer: TagReader if direction == 0: t_end = o_start - gap_a t_start = o_start - gap_b elif direction == 1: t_start = gap_a + o_start t_end = gap_b + o_start else: raise ValueError return cls( o_start=o_start, o_end=o_end, t_start=t_start, t_end=t_end, label=LabelEnum.i_to_label(polarity), ) def to_raw_triple(self) -> RawTriple: polarity = LabelEnum.label_to_i(self.label) if self.t_start < self.o_start: direction = 0 gap_a, gap_b = self.o_start - self.t_end, self.o_start - self.t_start else: direction = 1 gap_a, gap_b = self.t_start - self.o_start, self.t_end - self.o_start return [self.o_start, self.o_end], polarity, direction, gap_a, gap_b def as_text(self, tokens: List[str]) -> str: opinion = " ".join(tokens[self.o_start : self.o_end + 1]) target = " ".join(tokens[self.t_start : self.t_end + 1]) return f"{opinion}-{target} ({self.label})" class TripleHeuristic(BaseModel): @staticmethod def run( opinion_to_label: Dict[Span, LabelEnum], target_to_label: Dict[Span, LabelEnum], ) -> List[SentimentTriple]: # For each target, pair with the closest opinion (and vice versa) spans_o = list(opinion_to_label.keys()) spans_t = list(target_to_label.keys()) pos_o = np.expand_dims(np.array(spans_o).mean(axis=-1), axis=1) pos_t = np.expand_dims(np.array(spans_t).mean(axis=-1), axis=0) dists = np.absolute(pos_o - pos_t) raw_triples: Set[Tuple[int, int, LabelEnum]] = set() closest = np.argmin(dists, axis=1) for i, span in enumerate(spans_o): raw_triples.add((i, int(closest[i]), opinion_to_label[span])) closest = np.argmin(dists, axis=0) for i, span in enumerate(spans_t): raw_triples.add((int(closest[i]), i, target_to_label[span])) triples = [] for i, j, label in raw_triples: os, oe = spans_o[i] ts, te = spans_t[j] triples.append( SentimentTriple(o_start=os, o_end=oe, t_start=ts, t_end=te, label=label) ) return triples class TagMaker(BaseModel): @staticmethod def run(spans: List[Span], labels: List[LabelEnum], num_tokens: int) -> List[str]: raise NotImplementedError class BioesTagMaker(TagMaker): @staticmethod def run(spans: List[Span], labels: List[LabelEnum], num_tokens: int) -> List[str]: tags = ["O"] * num_tokens for (start, end), lab in zip(spans, labels): assert end >= start length = end - start + 1 if length == 1: tags[start] = f"S-{lab}" else: tags[start] = f"B-{lab}" tags[end] = f"E-{lab}" for i in range(start + 1, end): tags[i] = f"I-{lab}" return tags class Sentence(BaseModel): tokens: List[str] pos: List[str] weight: int id: int is_labeled: bool triples: List[SentimentTriple] spans: List[Tuple[int, int, LabelEnum]] = [] def extract_spans(self) -> List[Tuple[int, int, LabelEnum]]: spans = [] for t in self.triples: spans.append((t.o_start, t.o_end, LabelEnum.opinion)) spans.append((t.t_start, t.t_end, LabelEnum.target)) spans = sorted(set(spans)) return spans def as_text(self) -> str: tokens = list(self.tokens) for t in self.triples: tokens[t.o_start] = "(" + tokens[t.o_start] tokens[t.o_end] = tokens[t.o_end] + ")" tokens[t.t_start] = "[" + tokens[t.t_start] tokens[t.t_end] = tokens[t.t_end] + "]" return " ".join(tokens) @classmethod def from_line_format(cls, text: str): front, back = text.split("#### #### ####") tokens = front.split(" ") triples = [] for a, b, label in ast.literal_eval(back): t = SentimentTriple( t_start=a[0], t_end=a[0] if len(a) == 1 else a[-1], o_start=b[0], o_end=b[0] if len(b) == 1 else b[-1], label=label, ) triples.append(t) return cls( tokens=tokens, triples=triples, id=0, pos=[], weight=1, is_labeled=True ) def to_line_format(self) -> str: # ([1], [4], 'POS') # ([1,2], [4], 'POS') triplets = [] for t in self.triples: parts = [] for start, end in [(t.t_start, t.t_end), (t.o_start, t.o_end)]: if start == end: parts.append([start]) else: parts.append([start, end]) parts.append(f"{t.label}") triplets.append(tuple(parts)) line = " ".join(self.tokens) + "#### #### ####" + str(triplets) + "\n" assert self.from_line_format(line).tokens == self.tokens assert self.from_line_format(line).triples == self.triples return line class Data(BaseModel): root: Path data_split: SplitEnum sentences: Optional[List[Sentence]] full_path: str = "" num_instances: int = -1 opinion_offset: int = 3 # Refer: jet_o.py is_labeled: bool = False def load(self): if self.sentences is None: path = self.root / f"{self.data_split}.txt" if self.full_path: path = self.full_path with open(path) as f: self.sentences = [Sentence.from_line_format(line) for line in f] @classmethod def load_from_full_path(cls, path: str): data = cls(full_path=path, root=Path(path).parent, data_split=SplitEnum.train) data.load() return data def save_to_path(self, path: str): assert self.sentences is not None Path(path).parent.mkdir(exist_ok=True, parents=True) with open(path, "w") as f: for s in self.sentences: f.write(s.to_line_format()) data = Data.load_from_full_path(path) assert data.sentences is not None for i, s in enumerate(data.sentences): assert s.tokens == self.sentences[i].tokens assert s.triples == self.sentences[i].triples def analyze_spans(self): print("\nHow often is target closer to opinion than any invalid target?") records = [] for s in self.sentences: valid_pairs = set([(a.opinion, a.target) for a in s.triples]) for a in s.triples: closest = None for b in s.triples: dist_a = abs(np.mean(a.opinion) - np.mean(a.target)) dist_b = abs(np.mean(a.opinion) - np.mean(b.target)) if dist_b <= dist_a and (a.opinion, b.target) not in valid_pairs: closest = b.target spans = [a.opinion, a.target] if closest is not None: spans.append(closest) tokens = list(s.tokens) for start, end in spans: tokens[start] = "[" + tokens[start] tokens[end] = tokens[end] + "]" start = min([s[0] for s in spans]) end = max([s[1] for s in spans]) tokens = tokens[start : end + 1] records.append(dict(is_closest=closest is None, text=" ".join(tokens))) df = pd.DataFrame(records) print(df["is_closest"].mean()) print(df[~df["is_closest"]].head()) def analyze_joined_spans(self): print("\nHow often are target/opinion spans joined?") join_targets = 0 join_opinions = 0 total_targets = 0 total_opinions = 0 for s in self.sentences: targets = set([t.target for t in s.triples]) opinions = set([t.opinion for t in s.triples]) total_targets += len(targets) total_opinions += len(opinions) join_targets += count_joins(targets) join_opinions += count_joins(opinions) print( dict( targets=join_targets / total_targets, opinions=join_opinions / total_opinions, ) ) def analyze_tag_counts(self): print("\nHow many tokens are target/opinion/none?") record = [] for s in self.sentences: tags = [str(None) for _ in s.tokens] for t in s.triples: for i in range(t.o_start, t.o_end + 1): tags[i] = "Opinion" for i in range(t.t_start, t.t_end + 1): tags[i] = "Target" record.extend(tags) print({k: v / len(record) for k, v in Counter(record).items()}) def analyze_span_distance(self): print("\nHow far is the target/opinion from each other on average?") distances = [] for s in self.sentences: for t in s.triples: x_opinion = (t.o_start + t.o_end) / 2 x_target = (t.t_start + t.t_end) / 2 distances.append(abs(x_opinion - x_target)) print(get_simple_stats(distances)) def analyze_opinion_labels(self): print("\nFor opinion/target how often is it associated with only 1 polarity?") for key in ["opinion", "target"]: records = [] for s in self.sentences: term_to_labels: Dict[Tuple[int, int], List[LabelEnum]] = {} for t in s.triples: term_to_labels.setdefault(getattr(t, key), []).append(t.label) records.extend([len(set(labels)) for labels in term_to_labels.values()]) is_single_label = [n == 1 for n in records] print( dict( key=key, is_single_label=sum(is_single_label) / len(is_single_label), stats=get_simple_stats(records), ) ) def analyze_tag_score(self): print("\nIf have all target and opinion terms (unpaired), what is max f_score?") pred = copy.deepcopy(self.sentences) for s in pred: target_to_label = {t.target: t.label for t in s.triples} opinion_to_label = {t.opinion: t.label for t in s.triples} s.triples = TripleHeuristic().run(opinion_to_label, target_to_label) analyzer = ResultAnalyzer() analyzer.run(pred, gold=self.sentences, print_limit=0) def analyze_ner(self): print("\n How many opinion/target per sentence?") num_o, num_t = [], [] for s in self.sentences: opinions, targets = set(), set() for t in s.triples: opinions.add((t.o_start, t.o_end)) targets.add((t.t_start, t.t_end)) num_o.append(len(opinions)) num_t.append(len(targets)) print( dict( num_o=get_simple_stats(num_o), num_t=get_simple_stats(num_t), sentences=len(self.sentences), ) ) def analyze_direction(self): print("\n For targets, is opinion offset always positive/negative/both?") records = [] for s in self.sentences: span_to_offsets = {} for t in s.triples: off = np.mean(t.target) - np.mean(t.opinion) span_to_offsets.setdefault(t.opinion, []).append(off) for span, offsets in span_to_offsets.items(): labels = [ LabelEnum.positive if off > 0 else LabelEnum.negative for off in offsets ] lab = labels[0] if len(set(labels)) == 1 else LabelEnum.neutral records.append( dict( span=" ".join(s.tokens[span[0] : span[1] + 1]), text=s.as_text(), offsets=lab, ) ) df = pd.DataFrame(records) print(df["offsets"].value_counts(normalize=True)) df = df[df["offsets"] == LabelEnum.neutral].drop(columns=["offsets"]) with pd.option_context("display.max_colwidth", 999): print(df.head()) def analyze(self): triples = [t for s in self.sentences for t in s.triples] info = dict( root=self.root, sentences=len(self.sentences), sentiments=Counter([t.label for t in triples]), target_lengths=get_simple_stats( [abs(t.t_start - t.t_end) + 1 for t in triples] ), opinion_lengths=get_simple_stats( [abs(t.o_start - t.o_end) + 1 for t in triples] ), sentence_lengths=get_simple_stats([len(s.tokens) for s in self.sentences]), ) for k, v in info.items(): print(k, v) self.analyze_direction() self.analyze_ner() self.analyze_spans() self.analyze_joined_spans() self.analyze_tag_counts() self.analyze_span_distance() self.analyze_opinion_labels() self.analyze_tag_score() print("#" * 80) def test_save_to_path(path: str = "aste/data/triplet_data/14lap/train.txt"): print("\nEnsure that Data.save_to_path works properly") path_temp = "temp.txt" data = Data.load_from_full_path(path) data.save_to_path(path_temp) print("\nSamples") with open(path_temp) as f: for line in f.readlines()[:5]: print(line) os.remove(path_temp) def merge_data(items: List[Data]) -> Data: merged = Data(root=Path(), data_split=items[0].data_split, sentences=[]) for data in items: data.load() merged.sentences.extend(data.sentences) return merged class Result(BaseModel): num_sentences: int num_pred: int = 0 num_gold: int = 0 num_correct: int = 0 num_start_correct: int = 0 num_start_end_correct: int = 0 num_opinion_correct: int = 0 num_target_correct: int = 0 num_span_overlap: int = 0 precision: float = 0.0 recall: float = 0.0 f_score: float = 0.0 class ResultAnalyzer(BaseModel): @staticmethod def check_overlap(a_start: int, a_end: int, b_start: int, b_end: int) -> bool: return (b_start <= a_start <= b_end) or (b_start <= a_end <= b_end) @staticmethod def run_sentence(pred: Sentence, gold: Sentence): assert pred.tokens == gold.tokens triples_gold = set([t.as_text(gold.tokens) for t in gold.triples]) triples_pred = set([t.as_text(pred.tokens) for t in pred.triples]) tp = triples_pred.intersection(triples_gold) fp = triples_pred.difference(triples_gold) fn = triples_gold.difference(triples_pred) if fp or fn: print(dict(gold=gold.as_text())) print(dict(pred=pred.as_text())) print(dict(tp=tp)) print(dict(fp=fp)) print(dict(fn=fn)) print("#" * 80) @staticmethod def analyze_labels(pred: List[Sentence], gold: List[Sentence]): y_pred = [] y_gold = [] for i in range(len(pred)): for p in pred[i].triples: for g in gold[i].triples: if (p.opinion, p.target) == (g.opinion, g.target): y_pred.append(str(p.label)) y_gold.append(str(g.label)) print(dict(num_span_correct=len(y_pred))) if y_pred: print(classification_report(y_gold, y_pred)) @staticmethod def analyze_spans(pred: List[Sentence], gold: List[Sentence]): num_triples_gold, triples_found_o, triples_found_t = 0, set(), set() for label in [LabelEnum.opinion, LabelEnum.target]: num_correct, num_pred, num_gold = 0, 0, 0 is_target = {LabelEnum.opinion: False, LabelEnum.target: True}[label] for i, (p, g) in enumerate(zip(pred, gold)): spans_gold = set(g.spans if g.spans else g.extract_spans()) spans_pred = set(p.spans if p.spans else p.extract_spans()) spans_gold = set([s for s in spans_gold if s[-1] == label]) spans_pred = set([s for s in spans_pred if s[-1] == label]) num_gold += len(spans_gold) num_pred += len(spans_pred) num_correct += len(spans_gold.intersection(spans_pred)) for t in g.triples: num_triples_gold += 1 span = (t.target if is_target else t.opinion) + (label,) if span in spans_pred: t_unique = (i,) + tuple(t.dict().items()) if is_target: triples_found_t.add(t_unique) else: triples_found_o.add(t_unique) if num_correct and num_pred and num_gold: p = round(num_correct / num_pred, ndigits=4) r = round(num_correct / num_gold, ndigits=4) f = round(2 * p * r / (p + r), ndigits=4) info = dict(label=label, p=p, r=r, f=f) print(json.dumps(info, indent=2)) assert num_triples_gold % 2 == 0 # Was double-counted above num_triples_gold = num_triples_gold // 2 num_triples_pred_ceiling = len(triples_found_o.intersection(triples_found_t)) triples_pred_recall_ceiling = num_triples_pred_ceiling / num_triples_gold print("\n What is the upper bound for RE from predicted O & T?") print(dict(recall=round(triples_pred_recall_ceiling, ndigits=4))) @classmethod def run(cls, pred: List[Sentence], gold: List[Sentence], print_limit=16): assert len(pred) == len(gold) cls.analyze_labels(pred, gold) r = Result(num_sentences=len(pred)) for i in range(len(pred)): if i < print_limit: cls.run_sentence(pred[i], gold[i]) r.num_pred += len(pred[i].triples) r.num_gold += len(gold[i].triples) for p in pred[i].triples: for g in gold[i].triples: if p.dict() == g.dict(): r.num_correct += 1 if (p.o_start, p.t_start) == (g.o_start, g.t_start): r.num_start_correct += 1 if (p.opinion, p.target) == (g.opinion, g.target): r.num_start_end_correct += 1 if p.opinion == g.opinion: r.num_opinion_correct += 1 if p.target == g.target: r.num_target_correct += 1 if cls.check_overlap(*p.opinion, *g.opinion) and cls.check_overlap( *p.target, *g.target ): r.num_span_overlap += 1 e = 1e-9 r.precision = round(r.num_correct / (r.num_pred + e), 4) r.recall = round(r.num_correct / (r.num_gold + e), 4) r.f_score = round(2 * r.precision * r.recall / (r.precision + r.recall + e), 3) print(r.json(indent=2)) cls.analyze_spans(pred, gold) def test_merge(root="aste/data/triplet_data"): unmerged = [Data(root=p, data_split=SplitEnum.train) for p in Path(root).iterdir()] data = merge_data(unmerged) data.analyze() if __name__ == "__main__": Fire() ================================================ FILE: aste/utils.py ================================================ import copy import hashlib import pickle import subprocess import time from pathlib import Path from typing import List, Set, Tuple, Union from fire import Fire from pydantic import BaseModel class Shell(BaseModel): verbose: bool = True @classmethod def format_kwargs(cls, **kwargs) -> str: outputs = [] for k, v in kwargs.items(): k = k.replace("_", "-") k = f"--{k}" outputs.extend([k, str(v)]) return " ".join(outputs) def run_command(self, command: str) -> str: # Continuously print outputs for long-running commands # Refer: https://fabianlee.org/2019/09/15/python-getting-live-output-from-subprocess-using-poll/ print(dict(command=command)) process = subprocess.Popen(command, shell=True, stdout=subprocess.PIPE) outputs = [] while True: if process.poll() is not None: break o = process.stdout.readline().decode() if o: outputs.append(o) if self.verbose: print(o.strip()) return "".join(outputs) def run(self, command: str, *args, **kwargs) -> str: args = [str(a) for a in args] command = " ".join([command] + args + [self.format_kwargs(**kwargs)]) return self.run_command(command) def hash_text(x: str) -> str: return hashlib.md5(x.encode()).hexdigest() class Timer(BaseModel): name: str = "" start: float = 0.0 def __enter__(self): self.start = time.time() return self def __exit__(self, exc_type, exc_val, exc_tb): duration = round(time.time() - self.start, 3) print(f"Timer {self.name}: {duration}s") class PickleSaver(BaseModel): path: Path def dump(self, obj): if not self.path.parent.exists(): self.path.parent.mkdir(exist_ok=True) with open(self.path, "wb") as f: pickle.dump(obj, f) def load(self): with Timer(name=str(self.path)): with open(self.path, "rb") as f: return pickle.load(f) class FlexiModel(BaseModel): class Config: arbitrary_types_allowed = True def get_simple_stats(numbers: List[Union[int, float]]): return dict( min=min(numbers), max=max(numbers), avg=sum(numbers) / len(numbers), ) def count_joins(spans: Set[Tuple[int, int]]) -> int: count = 0 for a_start, a_end in spans: for b_start, b_end in spans: if (a_start, a_end) == (b_start, b_end): continue if b_start <= a_start <= b_end + 1 or b_start - 1 <= a_end <= b_end: count += 1 return count // 2 def update_nested_dict(d: dict, k: str, v, i=0, sep="__"): d = copy.deepcopy(d) keys = k.split(sep) assert keys[i] in d.keys(), str(dict(keys=keys, d=d, i=i)) if i == len(keys) - 1: orig = d[keys[i]] if v != orig: print(dict(updated_key=k, new_value=v, orig=orig)) d[keys[i]] = v else: d[keys[i]] = update_nested_dict(d=d[keys[i]], k=k, v=v, i=i + 1) return d def test_update_nested_dict(): d = dict(top=dict(middle_a=dict(last=1), middle_b=0)) print(update_nested_dict(d, k="top__middle_b", v=-1)) print(update_nested_dict(d, k="top__middle_a__last", v=-1)) print(update_nested_dict(d, k="top__middle_a__last", v=1)) def clean_up_triplet_data(path: str): outputs = [] with open(path) as f: for line in f: sep = "####" text, tags_t, tags_o, triplets = line.split(sep) outputs.append(sep.join([text, " ", " ", triplets])) with open(path, "w") as f: f.write("".join(outputs)) def clean_up_many(pattern: str = "data/triplet_data/*/*.txt"): for path in sorted(Path().glob(pattern)): print(path) clean_up_triplet_data(str(path)) def merge_data( folders_in: List[str] = [ "aste/data/triplet_data/14res/", "aste/data/triplet_data/15res/", "aste/data/triplet_data/16res/", ], folder_out: str = "aste/data/triplet_data/res_all/", ): for name in ["train.txt", "dev.txt", "test.txt"]: outputs = [] for folder in folders_in: path = Path(folder) / name with open(path) as f: for line in f: assert line.endswith("\n") outputs.append(line) path_out = Path(folder_out) / name path_out.parent.mkdir(exist_ok=True, parents=True) with open(path_out, "w") as f: f.write("".join(outputs)) def safe_divide(a: float, b: float) -> float: if a == 0 or b == 0: return 0 return a / b if __name__ == "__main__": Fire() ================================================ FILE: aste/wrapper.py ================================================ import json import os import shutil import sys from argparse import Namespace from pathlib import Path from typing import List, Tuple, Optional from allennlp.commands.predict import _predict from allennlp.commands.train import train_model from allennlp.common import Params from fire import Fire from pydantic import BaseModel from tqdm import tqdm from data_utils import Data, SentimentTriple, SplitEnum, Sentence, LabelEnum from utils import safe_divide class SpanModelDocument(BaseModel): sentences: List[List[str]] ner: List[List[Tuple[int, int, str]]] relations: List[List[Tuple[int, int, int, int, str]]] doc_key: str @property def is_valid(self) -> bool: return len(set(map(len, [self.sentences, self.ner, self.relations]))) == 1 @classmethod def from_sentence(cls, x: Sentence): ner: List[Tuple[int, int, str]] = [] for t in x.triples: ner.append((t.o_start, t.o_end, LabelEnum.opinion)) ner.append((t.t_start, t.t_end, LabelEnum.target)) ner = sorted(set(ner), key=lambda n: n[0]) relations = [ (t.o_start, t.o_end, t.t_start, t.t_end, t.label) for t in x.triples ] return cls( sentences=[x.tokens], ner=[ner], relations=[relations], doc_key=str(x.id), ) class SpanModelPrediction(SpanModelDocument): predicted_ner: List[List[Tuple[int, int, LabelEnum, float, float]]] = [ [] ] # If loss_weights["ner"] == 0.0 predicted_relations: List[List[Tuple[int, int, int, int, LabelEnum, float, float]]] def to_sentence(self) -> Sentence: for lst in [self.sentences, self.predicted_ner, self.predicted_relations]: assert len(lst) == 1 triples = [ SentimentTriple(o_start=os, o_end=oe, t_start=ts, t_end=te, label=label) for os, oe, ts, te, label, value, prob in self.predicted_relations[0] ] return Sentence( id=int(self.doc_key), tokens=self.sentences[0], pos=[], weight=1, is_labeled=False, triples=triples, spans=[lst[:3] for lst in self.predicted_ner[0]], ) class SpanModelData(BaseModel): root: Path data_split: SplitEnum documents: Optional[List[SpanModelDocument]] @classmethod def read(cls, path: Path) -> List[SpanModelDocument]: docs = [] with open(path) as f: for line in f: line = line.strip() raw: dict = json.loads(line) docs.append(SpanModelDocument(**raw)) return docs def load(self): if self.documents is None: path = self.root / f"{self.data_split}.json" self.documents = self.read(path) def dump(self, path: Path, sep="\n"): for d in self.documents: assert d.is_valid with open(path, "w") as f: f.write(sep.join([d.json() for d in self.documents])) assert all( [a.dict() == b.dict() for a, b in zip(self.documents, self.read(path))] ) @classmethod def from_data(cls, x: Data): data = cls(root=x.root, data_split=x.data_split) data.documents = [SpanModelDocument.from_sentence(s) for s in x.sentences] return data class SpanModel(BaseModel): save_dir: str random_seed: int path_config_base: str = "training_config/config.jsonnet" def save_temp_data(self, path_in: str, name: str, is_test: bool = False) -> Path: path_temp = Path(self.save_dir) / "temp_data" / f"{name}.json" path_temp = path_temp.resolve() path_temp.parent.mkdir(exist_ok=True, parents=True) data = Data.load_from_full_path(path_in) if is_test: # SpanModel error if s.triples is empty list assert data.sentences is not None for s in data.sentences: s.triples = [SentimentTriple.make_dummy()] span_data = SpanModelData.from_data(data) span_data.dump(path_temp) return path_temp def fit(self, path_train: str, path_dev: str): weights_dir = Path(self.save_dir) / "weights" weights_dir.mkdir(exist_ok=True, parents=True) print(dict(weights_dir=weights_dir)) params = Params.from_file( self.path_config_base, params_overrides=dict( random_seed=self.random_seed, numpy_seed=self.random_seed, pytorch_seed=self.random_seed, train_data_path=str(self.save_temp_data(path_train, "train")), validation_data_path=str(self.save_temp_data(path_dev, "dev")), test_data_path=str(self.save_temp_data(path_dev, "dev")), ), ) # Register custom modules sys.path.append(".") from span_model.data.dataset_readers.span_model import SpanModelReader assert SpanModelReader is not None train_model(params, serialization_dir=str(weights_dir)) def predict(self, path_in: str, path_out: str): path_model = Path(self.save_dir) / "weights" / "model.tar.gz" path_temp_in = self.save_temp_data(path_in, "pred_in", is_test=True) path_temp_out = Path(self.save_dir) / "temp_data" / "pred_out.json" if path_temp_out.exists(): os.remove(path_temp_out) args = Namespace( archive_file=str(path_model), input_file=str(path_temp_in), output_file=str(path_temp_out), weights_file="", batch_size=1, silent=True, cuda_device=0, use_dataset_reader=True, dataset_reader_choice="validation", overrides="", predictor="span_model", file_friendly_logging=False, ) # Register custom modules sys.path.append(".") from span_model.data.dataset_readers.span_model import SpanModelReader from span_model.predictors.span_model import SpanModelPredictor assert SpanModelReader is not None assert SpanModelPredictor is not None _predict(args) with open(path_temp_out) as f: preds = [SpanModelPrediction(**json.loads(line.strip())) for line in f] data = Data( root=Path(), data_split=SplitEnum.test, sentences=[p.to_sentence() for p in preds], ) data.save_to_path(path_out) @classmethod def score(cls, path_pred: str, path_gold: str) -> dict: pred = Data.load_from_full_path(path_pred) gold = Data.load_from_full_path(path_gold) assert pred.sentences is not None assert gold.sentences is not None assert len(pred.sentences) == len(gold.sentences) num_pred = 0 num_gold = 0 num_correct = 0 for i in range(len(gold.sentences)): num_pred += len(pred.sentences[i].triples) num_gold += len(gold.sentences[i].triples) for p in pred.sentences[i].triples: for g in gold.sentences[i].triples: if p.dict() == g.dict(): num_correct += 1 precision = safe_divide(num_correct, num_pred) recall = safe_divide(num_correct, num_gold) info = dict( path_pred=path_pred, path_gold=path_gold, precision=precision, recall=recall, score=safe_divide(2 * precision * recall, precision + recall), ) return info def run_score(path_pred: str, path_gold: str) -> dict: return SpanModel.score(path_pred, path_gold) def run_train(path_train: str, path_dev: str, save_dir: str, random_seed: int): print(dict(run_train=locals())) if Path(save_dir).exists(): return model = SpanModel(save_dir=save_dir, random_seed=random_seed) model.fit(path_train, path_dev) def run_train_many(save_dir_template: str, random_seeds: List[int], **kwargs): for seed in tqdm(random_seeds): save_dir = save_dir_template.format(seed) run_train(save_dir=save_dir, random_seed=seed, **kwargs) def run_eval(path_test: str, save_dir: str): print(dict(run_eval=locals())) model = SpanModel(save_dir=save_dir, random_seed=0) path_pred = str(Path(save_dir) / "pred.txt") model.predict(path_test, path_pred) results = model.score(path_pred, path_test) print(results) return results def run_eval_many(save_dir_template: str, random_seeds: List[int], **kwargs): results = [] for seed in tqdm(random_seeds): save_dir = save_dir_template.format(seed) results.append(run_eval(save_dir=save_dir, **kwargs)) precision = sum(r["precision"] for r in results) / len(random_seeds) recall = sum(r["recall"] for r in results) / len(random_seeds) score = safe_divide(2 * precision * recall, precision + recall) print(dict(precision=precision, recall=recall, score=score)) if __name__ == "__main__": Fire() ================================================ FILE: demo.ipynb ================================================ { "cells": [ { "cell_type": "code", "execution_count": 1, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "izKXA4b6-oIv", "outputId": "1b436740-e1e0-4e01-e3f5-6325ce29907a" }, "outputs": [ { "output_type": "stream", "name": "stdout", "text": [ "Cloning into 'Span-ASTE'...\n", "remote: Enumerating objects: 191, done.\u001B[K\n", "remote: Counting objects: 100% (97/97), done.\u001B[K\n", "remote: Compressing objects: 100% (59/59), done.\u001B[K\n", "remote: Total 191 (delta 58), reused 61 (delta 36), pack-reused 94\u001B[K\n", "Receiving objects: 100% (191/191), 626.87 KiB | 23.22 MiB/s, done.\n", "Resolving deltas: 100% (80/80), done.\n", "Note: checking out 'f53ec3c'.\n", "\n", "You are in 'detached HEAD' state. You can look around, make experimental\n", "changes and commit them, and you can discard any commits you make in this\n", "state without impacting any branches by performing another checkout.\n", "\n", "If you want to create a new branch to retain commits you create, you may\n", "do so (now or later) by using -b with the checkout command again. Example:\n", "\n", " git checkout -b \n", "\n", "HEAD is now at f53ec3c Add command-line scoring instructions in README.md\n", "Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/\n", "Collecting Cython==0.29.21\n", " Downloading Cython-0.29.21-cp37-cp37m-manylinux1_x86_64.whl (2.0 MB)\n", "\u001B[K |████████████████████████████████| 2.0 MB 18.3 MB/s \n", "\u001B[?25hCollecting PYEVALB==0.1.3\n", " Downloading PYEVALB-0.1.3-py3-none-any.whl (13 kB)\n", "Collecting allennlp-models==1.2.2\n", " Downloading allennlp_models-1.2.2-py3-none-any.whl (353 kB)\n", "\u001B[K |████████████████████████████████| 353 kB 69.5 MB/s \n", "\u001B[?25hCollecting allennlp==1.2.2\n", " Downloading allennlp-1.2.2-py3-none-any.whl (505 kB)\n", "\u001B[K |████████████████████████████████| 505 kB 39.7 MB/s \n", "\u001B[?25hCollecting botocore==1.19.46\n", " Downloading botocore-1.19.46-py2.py3-none-any.whl (7.2 MB)\n", "\u001B[K |████████████████████████████████| 7.2 MB 34.0 MB/s \n", "\u001B[?25hCollecting fire==0.3.1\n", " Downloading fire-0.3.1.tar.gz (81 kB)\n", "\u001B[K |████████████████████████████████| 81 kB 10.6 MB/s \n", "\u001B[?25hCollecting nltk==3.6.6\n", " Downloading nltk-3.6.6-py3-none-any.whl (1.5 MB)\n", "\u001B[K |████████████████████████████████| 1.5 MB 57.0 MB/s \n", "\u001B[?25hCollecting numpy==1.21.5\n", " Downloading numpy-1.21.5-cp37-cp37m-manylinux_2_12_x86_64.manylinux2010_x86_64.whl (15.7 MB)\n", "\u001B[K |████████████████████████████████| 15.7 MB 49.4 MB/s \n", "\u001B[?25hCollecting pandas==1.1.5\n", " Downloading pandas-1.1.5-cp37-cp37m-manylinux1_x86_64.whl (9.5 MB)\n", "\u001B[K |████████████████████████████████| 9.5 MB 53.1 MB/s \n", "\u001B[?25hCollecting pydantic==1.6.2\n", " Downloading pydantic-1.6.2-cp37-cp37m-manylinux2014_x86_64.whl (8.6 MB)\n", "\u001B[K |████████████████████████████████| 8.6 MB 28.2 MB/s \n", "\u001B[?25hCollecting scikit-learn==0.22.2.post1\n", " Downloading scikit_learn-0.22.2.post1-cp37-cp37m-manylinux1_x86_64.whl (7.1 MB)\n", "\u001B[K |████████████████████████████████| 7.1 MB 48.9 MB/s \n", "\u001B[?25hCollecting torch==1.7.0\n", " Downloading torch-1.7.0-cp37-cp37m-manylinux1_x86_64.whl (776.7 MB)\n", "\u001B[K |████████████████████████████████| 776.7 MB 4.4 kB/s \n", "\u001B[?25hCollecting torchvision==0.8.1\n", " Downloading torchvision-0.8.1-cp37-cp37m-manylinux1_x86_64.whl (12.7 MB)\n", "\u001B[K |████████████████████████████████| 12.7 MB 41.9 MB/s \n", "\u001B[?25hCollecting transformers==3.4.0\n", " Downloading transformers-3.4.0-py3-none-any.whl (1.3 MB)\n", "\u001B[K |████████████████████████████████| 1.3 MB 58.1 MB/s \n", "\u001B[?25hCollecting boto3==1.16.46\n", " Downloading boto3-1.16.46-py2.py3-none-any.whl (130 kB)\n", "\u001B[K |████████████████████████████████| 130 kB 75.8 MB/s \n", "\u001B[?25hCollecting pytablewriter>=0.10.2\n", " Downloading pytablewriter-0.64.2-py3-none-any.whl (106 kB)\n", "\u001B[K |████████████████████████████████| 106 kB 71.7 MB/s \n", "\u001B[?25hCollecting word2number>=1.1\n", " Downloading word2number-1.1.zip (9.7 kB)\n", "Collecting ftfy\n", " Downloading ftfy-6.1.1-py3-none-any.whl (53 kB)\n", "\u001B[K |████████████████████████████████| 53 kB 2.1 MB/s \n", "\u001B[?25hCollecting conllu==4.2.1\n", " Downloading conllu-4.2.1-py2.py3-none-any.whl (14 kB)\n", "Collecting py-rouge==1.1\n", " Downloading py_rouge-1.1-py3-none-any.whl (56 kB)\n", "\u001B[K |████████████████████████████████| 56 kB 3.5 MB/s \n", "\u001B[?25hCollecting overrides==3.1.0\n", " Downloading overrides-3.1.0.tar.gz (11 kB)\n", "Requirement already satisfied: h5py in /usr/local/lib/python3.7/dist-packages (from allennlp==1.2.2->-r requirements.txt (line 4)) (3.1.0)\n", "Collecting jsonpickle\n", " Downloading jsonpickle-2.2.0-py2.py3-none-any.whl (39 kB)\n", "Requirement already satisfied: pytest in /usr/local/lib/python3.7/dist-packages (from allennlp==1.2.2->-r requirements.txt (line 4)) (3.6.4)\n", "Collecting spacy<2.4,>=2.1.0\n", " Downloading spacy-2.3.8-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (4.8 MB)\n", "\u001B[K |████████████████████████████████| 4.8 MB 50.8 MB/s \n", "\u001B[?25hRequirement already satisfied: tqdm>=4.19 in /usr/local/lib/python3.7/dist-packages (from allennlp==1.2.2->-r requirements.txt (line 4)) (4.64.1)\n", "Collecting filelock<3.1,>=3.0\n", " Downloading filelock-3.0.12-py3-none-any.whl (7.6 kB)\n", "Requirement already satisfied: requests>=2.18 in /usr/local/lib/python3.7/dist-packages (from allennlp==1.2.2->-r requirements.txt (line 4)) (2.23.0)\n", "Requirement already satisfied: scipy in /usr/local/lib/python3.7/dist-packages (from allennlp==1.2.2->-r requirements.txt (line 4)) (1.7.3)\n", "Collecting tensorboardX>=1.2\n", " Downloading tensorboardX-2.5.1-py2.py3-none-any.whl (125 kB)\n", "\u001B[K |████████████████████████████████| 125 kB 58.4 MB/s \n", "\u001B[?25hCollecting jsonnet>=0.10.0\n", " Downloading jsonnet-0.19.1.tar.gz (593 kB)\n", "\u001B[K |████████████████████████████████| 593 kB 72.4 MB/s \n", "\u001B[?25hCollecting jmespath<1.0.0,>=0.7.1\n", " Downloading jmespath-0.10.0-py2.py3-none-any.whl (24 kB)\n", "Collecting urllib3<1.27,>=1.25.4\n", " Downloading urllib3-1.26.13-py2.py3-none-any.whl (140 kB)\n", "\u001B[K |████████████████████████████████| 140 kB 67.8 MB/s \n", "\u001B[?25hRequirement already satisfied: python-dateutil<3.0.0,>=2.1 in /usr/local/lib/python3.7/dist-packages (from botocore==1.19.46->-r requirements.txt (line 5)) (2.8.2)\n", "Requirement already satisfied: six in /usr/local/lib/python3.7/dist-packages (from fire==0.3.1->-r requirements.txt (line 6)) (1.15.0)\n", "Requirement already satisfied: termcolor in /usr/local/lib/python3.7/dist-packages (from fire==0.3.1->-r requirements.txt (line 6)) (2.1.0)\n", "Requirement already satisfied: joblib in /usr/local/lib/python3.7/dist-packages (from nltk==3.6.6->-r requirements.txt (line 7)) (1.2.0)\n", "Requirement already satisfied: regex>=2021.8.3 in /usr/local/lib/python3.7/dist-packages (from nltk==3.6.6->-r requirements.txt (line 7)) (2022.6.2)\n", "Requirement already satisfied: click in /usr/local/lib/python3.7/dist-packages (from nltk==3.6.6->-r requirements.txt (line 7)) (7.1.2)\n", "Requirement already satisfied: pytz>=2017.2 in /usr/local/lib/python3.7/dist-packages (from pandas==1.1.5->-r requirements.txt (line 9)) (2022.6)\n", "Requirement already satisfied: typing-extensions in /usr/local/lib/python3.7/dist-packages (from torch==1.7.0->-r requirements.txt (line 12)) (4.1.1)\n", "Collecting dataclasses\n", " Downloading dataclasses-0.6-py3-none-any.whl (14 kB)\n", "Requirement already satisfied: future in /usr/local/lib/python3.7/dist-packages (from torch==1.7.0->-r requirements.txt (line 12)) (0.16.0)\n", "Requirement already satisfied: pillow>=4.1.1 in /usr/local/lib/python3.7/dist-packages (from torchvision==0.8.1->-r requirements.txt (line 13)) (7.1.2)\n", "Requirement already satisfied: protobuf in /usr/local/lib/python3.7/dist-packages (from transformers==3.4.0->-r requirements.txt (line 14)) (3.19.6)\n", "Collecting sacremoses\n", " Downloading sacremoses-0.0.53.tar.gz (880 kB)\n", "\u001B[K |████████████████████████████████| 880 kB 67.9 MB/s \n", "\u001B[?25hCollecting tokenizers==0.9.2\n", " Downloading tokenizers-0.9.2-cp37-cp37m-manylinux1_x86_64.whl (2.9 MB)\n", "\u001B[K |████████████████████████████████| 2.9 MB 45.8 MB/s \n", "\u001B[?25hCollecting sentencepiece!=0.1.92\n", " Downloading sentencepiece-0.1.97-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.3 MB)\n", "\u001B[K |████████████████████████████████| 1.3 MB 62.0 MB/s \n", "\u001B[?25hRequirement already satisfied: packaging in /usr/local/lib/python3.7/dist-packages (from transformers==3.4.0->-r requirements.txt (line 14)) (21.3)\n", "Collecting s3transfer<0.4.0,>=0.3.0\n", " Downloading s3transfer-0.3.7-py2.py3-none-any.whl (73 kB)\n", "\u001B[K |████████████████████████████████| 73 kB 2.4 MB/s \n", "\u001B[?25hCollecting typepy[datetime]<2,>=1.2.0\n", " Downloading typepy-1.3.0-py3-none-any.whl (31 kB)\n", "Collecting pathvalidate<3,>=2.3.0\n", " Downloading pathvalidate-2.5.2-py3-none-any.whl (20 kB)\n", "Collecting tabledata<2,>=1.3.0\n", " Downloading tabledata-1.3.0-py3-none-any.whl (11 kB)\n", "Collecting mbstrdecoder<2,>=1.0.0\n", " Downloading mbstrdecoder-1.1.1-py3-none-any.whl (7.7 kB)\n", "Collecting DataProperty<2,>=0.55.0\n", " Downloading DataProperty-0.55.0-py3-none-any.whl (26 kB)\n", "Collecting tcolorpy<1,>=0.0.5\n", " Downloading tcolorpy-0.1.2-py3-none-any.whl (7.9 kB)\n", "Requirement already satisfied: setuptools>=38.3.0 in /usr/local/lib/python3.7/dist-packages (from pytablewriter>=0.10.2->PYEVALB==0.1.3->-r requirements.txt (line 2)) (57.4.0)\n", "Requirement already satisfied: chardet<6,>=3.0.4 in /usr/local/lib/python3.7/dist-packages (from mbstrdecoder<2,>=1.0.0->pytablewriter>=0.10.2->PYEVALB==0.1.3->-r requirements.txt (line 2)) (3.0.4)\n", "Requirement already satisfied: idna<3,>=2.5 in /usr/local/lib/python3.7/dist-packages (from requests>=2.18->allennlp==1.2.2->-r requirements.txt (line 4)) (2.10)\n", "Requirement already satisfied: certifi>=2017.4.17 in /usr/local/lib/python3.7/dist-packages (from requests>=2.18->allennlp==1.2.2->-r requirements.txt (line 4)) (2022.9.24)\n", "Collecting urllib3<1.27,>=1.25.4\n", " Downloading urllib3-1.25.11-py2.py3-none-any.whl (127 kB)\n", "\u001B[K |████████████████████████████████| 127 kB 73.6 MB/s \n", "\u001B[?25hRequirement already satisfied: wasabi<1.1.0,>=0.4.0 in /usr/local/lib/python3.7/dist-packages (from spacy<2.4,>=2.1.0->allennlp==1.2.2->-r requirements.txt (line 4)) (0.10.1)\n", "Collecting catalogue<1.1.0,>=0.0.7\n", " Downloading catalogue-1.0.2-py2.py3-none-any.whl (16 kB)\n", "Collecting srsly<1.1.0,>=1.0.2\n", " Downloading srsly-1.0.6-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (208 kB)\n", "\u001B[K |████████████████████████████████| 208 kB 71.2 MB/s \n", "\u001B[?25hRequirement already satisfied: cymem<2.1.0,>=2.0.2 in /usr/local/lib/python3.7/dist-packages (from spacy<2.4,>=2.1.0->allennlp==1.2.2->-r requirements.txt (line 4)) (2.0.7)\n", "Collecting thinc<7.5.0,>=7.4.1\n", " Downloading thinc-7.4.6-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.0 MB)\n", "\u001B[K |████████████████████████████████| 1.0 MB 58.3 MB/s \n", "\u001B[?25hRequirement already satisfied: preshed<3.1.0,>=3.0.2 in /usr/local/lib/python3.7/dist-packages (from spacy<2.4,>=2.1.0->allennlp==1.2.2->-r requirements.txt (line 4)) (3.0.8)\n", "Collecting plac<1.2.0,>=0.9.6\n", " Downloading plac-1.1.3-py2.py3-none-any.whl (20 kB)\n", "Requirement already satisfied: murmurhash<1.1.0,>=0.28.0 in /usr/local/lib/python3.7/dist-packages (from spacy<2.4,>=2.1.0->allennlp==1.2.2->-r requirements.txt (line 4)) (1.0.9)\n", "Requirement already satisfied: blis<0.8.0,>=0.4.0 in /usr/local/lib/python3.7/dist-packages (from spacy<2.4,>=2.1.0->allennlp==1.2.2->-r requirements.txt (line 4)) (0.7.9)\n", "Requirement already satisfied: zipp>=0.5 in /usr/local/lib/python3.7/dist-packages (from catalogue<1.1.0,>=0.0.7->spacy<2.4,>=2.1.0->allennlp==1.2.2->-r requirements.txt (line 4)) (3.10.0)\n", "Requirement already satisfied: wcwidth>=0.2.5 in /usr/local/lib/python3.7/dist-packages (from ftfy->allennlp-models==1.2.2->-r requirements.txt (line 3)) (0.2.5)\n", "Requirement already satisfied: cached-property in /usr/local/lib/python3.7/dist-packages (from h5py->allennlp==1.2.2->-r requirements.txt (line 4)) (1.5.2)\n", "Requirement already satisfied: importlib-metadata in /usr/local/lib/python3.7/dist-packages (from jsonpickle->allennlp==1.2.2->-r requirements.txt (line 4)) (4.13.0)\n", "Requirement already satisfied: pyparsing!=3.0.5,>=2.0.2 in /usr/local/lib/python3.7/dist-packages (from packaging->transformers==3.4.0->-r requirements.txt (line 14)) (3.0.9)\n", "Requirement already satisfied: atomicwrites>=1.0 in /usr/local/lib/python3.7/dist-packages (from pytest->allennlp==1.2.2->-r requirements.txt (line 4)) (1.4.1)\n", "Requirement already satisfied: py>=1.5.0 in /usr/local/lib/python3.7/dist-packages (from pytest->allennlp==1.2.2->-r requirements.txt (line 4)) (1.11.0)\n", "Requirement already satisfied: pluggy<0.8,>=0.5 in /usr/local/lib/python3.7/dist-packages (from pytest->allennlp==1.2.2->-r requirements.txt (line 4)) (0.7.1)\n", "Requirement already satisfied: more-itertools>=4.0.0 in /usr/local/lib/python3.7/dist-packages (from pytest->allennlp==1.2.2->-r requirements.txt (line 4)) (9.0.0)\n", "Requirement already satisfied: attrs>=17.4.0 in /usr/local/lib/python3.7/dist-packages (from pytest->allennlp==1.2.2->-r requirements.txt (line 4)) (22.1.0)\n", "Building wheels for collected packages: fire, overrides, jsonnet, word2number, sacremoses\n", " Building wheel for fire (setup.py) ... \u001B[?25l\u001B[?25hdone\n", " Created wheel for fire: filename=fire-0.3.1-py2.py3-none-any.whl size=111023 sha256=867877500d51fc1466978cad4ed0d27cb550966ead11c09f6ebb1c29d326c4d7\n", " Stored in directory: /root/.cache/pip/wheels/95/38/e1/8b62337a8ecf5728bdc1017e828f253f7a9cf25db999861bec\n", " Building wheel for overrides (setup.py) ... \u001B[?25l\u001B[?25hdone\n", " Created wheel for overrides: filename=overrides-3.1.0-py3-none-any.whl size=10187 sha256=f29e5574b1a87b6159f1a10bd1d4884e547a8f0c981fdf36b32f876ba81e67fc\n", " Stored in directory: /root/.cache/pip/wheels/3a/0d/38/01a9bc6e20dcfaf0a6a7b552d03137558ba1c38aea47644682\n", " Building wheel for jsonnet (setup.py) ... \u001B[?25l\u001B[?25hdone\n", " Created wheel for jsonnet: filename=jsonnet-0.19.1-cp37-cp37m-linux_x86_64.whl size=3997237 sha256=65b35b399530104bd0f8d4c9e9854bf5b1ea5fa5ef562a7a2991994f048d31c4\n", " Stored in directory: /root/.cache/pip/wheels/03/6b/48/a168ed5f8d01c50268605eff341c29126286763607bf707e3b\n", " Building wheel for word2number (setup.py) ... \u001B[?25l\u001B[?25hdone\n", " Created wheel for word2number: filename=word2number-1.1-py3-none-any.whl size=5582 sha256=db776042f55344c643ceb582cc4583b9f7af2c165fd065777f58e72b1fbb68e4\n", " Stored in directory: /root/.cache/pip/wheels/4b/c3/77/a5f48aeb0d3efb7cd5ad61cbd3da30bbf9ffc9662b07c9f879\n", " Building wheel for sacremoses (setup.py) ... \u001B[?25l\u001B[?25hdone\n", " Created wheel for sacremoses: filename=sacremoses-0.0.53-py3-none-any.whl size=895260 sha256=bf922fe785a540d21b8a0d5061ff77f1b7f7bdf172b948ea4af6e6b3817594b8\n", " Stored in directory: /root/.cache/pip/wheels/87/39/dd/a83eeef36d0bf98e7a4d1933a4ad2d660295a40613079bafc9\n", "Successfully built fire overrides jsonnet word2number sacremoses\n", "Installing collected packages: mbstrdecoder, urllib3, typepy, numpy, jmespath, srsly, plac, catalogue, botocore, tokenizers, thinc, sentencepiece, sacremoses, s3transfer, filelock, DataProperty, dataclasses, transformers, torch, tensorboardX, tcolorpy, tabledata, spacy, scikit-learn, pathvalidate, overrides, nltk, jsonpickle, jsonnet, boto3, word2number, pytablewriter, py-rouge, ftfy, conllu, allennlp, torchvision, PYEVALB, pydantic, pandas, fire, Cython, allennlp-models\n", " Attempting uninstall: urllib3\n", " Found existing installation: urllib3 1.24.3\n", " Uninstalling urllib3-1.24.3:\n", " Successfully uninstalled urllib3-1.24.3\n", " Attempting uninstall: numpy\n", " Found existing installation: numpy 1.21.6\n", " Uninstalling numpy-1.21.6:\n", " Successfully uninstalled numpy-1.21.6\n", " Attempting uninstall: srsly\n", " Found existing installation: srsly 2.4.5\n", " Uninstalling srsly-2.4.5:\n", " Successfully uninstalled srsly-2.4.5\n", " Attempting uninstall: catalogue\n", " Found existing installation: catalogue 2.0.8\n", " Uninstalling catalogue-2.0.8:\n", " Successfully uninstalled catalogue-2.0.8\n", " Attempting uninstall: thinc\n", " Found existing installation: thinc 8.1.5\n", " Uninstalling thinc-8.1.5:\n", " Successfully uninstalled thinc-8.1.5\n", " Attempting uninstall: filelock\n", " Found existing installation: filelock 3.8.0\n", " Uninstalling filelock-3.8.0:\n", " Successfully uninstalled filelock-3.8.0\n", " Attempting uninstall: torch\n", " Found existing installation: torch 1.12.1+cu113\n", " Uninstalling torch-1.12.1+cu113:\n", " Successfully uninstalled torch-1.12.1+cu113\n", " Attempting uninstall: spacy\n", " Found existing installation: spacy 3.4.3\n", " Uninstalling spacy-3.4.3:\n", " Successfully uninstalled spacy-3.4.3\n", " Attempting uninstall: scikit-learn\n", " Found existing installation: scikit-learn 1.0.2\n", " Uninstalling scikit-learn-1.0.2:\n", " Successfully uninstalled scikit-learn-1.0.2\n", " Attempting uninstall: nltk\n", " Found existing installation: nltk 3.7\n", " Uninstalling nltk-3.7:\n", " Successfully uninstalled nltk-3.7\n", " Attempting uninstall: torchvision\n", " Found existing installation: torchvision 0.13.1+cu113\n", " Uninstalling torchvision-0.13.1+cu113:\n", " Successfully uninstalled torchvision-0.13.1+cu113\n", " Attempting uninstall: pydantic\n", " Found existing installation: pydantic 1.10.2\n", " Uninstalling pydantic-1.10.2:\n", " Successfully uninstalled pydantic-1.10.2\n", " Attempting uninstall: pandas\n", " Found existing installation: pandas 1.3.5\n", " Uninstalling pandas-1.3.5:\n", " Successfully uninstalled pandas-1.3.5\n", " Attempting uninstall: Cython\n", " Found existing installation: Cython 0.29.32\n", " Uninstalling Cython-0.29.32:\n", " Successfully uninstalled Cython-0.29.32\n", "\u001B[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.\n", "yellowbrick 1.5 requires scikit-learn>=1.0.0, but you have scikit-learn 0.22.2.post1 which is incompatible.\n", "torchtext 0.13.1 requires torch==1.12.1, but you have torch 1.7.0 which is incompatible.\n", "torchaudio 0.12.1+cu113 requires torch==1.12.1, but you have torch 1.7.0 which is incompatible.\n", "imbalanced-learn 0.8.1 requires scikit-learn>=0.24, but you have scikit-learn 0.22.2.post1 which is incompatible.\n", "fastai 2.7.10 requires torchvision>=0.8.2, but you have torchvision 0.8.1 which is incompatible.\n", "en-core-web-sm 3.4.1 requires spacy<3.5.0,>=3.4.0, but you have spacy 2.3.8 which is incompatible.\n", "confection 0.0.3 requires pydantic!=1.8,!=1.8.1,<1.11.0,>=1.7.4, but you have pydantic 1.6.2 which is incompatible.\n", "confection 0.0.3 requires srsly<3.0.0,>=2.4.0, but you have srsly 1.0.6 which is incompatible.\u001B[0m\n", "Successfully installed Cython-0.29.21 DataProperty-0.55.0 PYEVALB-0.1.3 allennlp-1.2.2 allennlp-models-1.2.2 boto3-1.16.46 botocore-1.19.46 catalogue-1.0.2 conllu-4.2.1 dataclasses-0.6 filelock-3.0.12 fire-0.3.1 ftfy-6.1.1 jmespath-0.10.0 jsonnet-0.19.1 jsonpickle-2.2.0 mbstrdecoder-1.1.1 nltk-3.6.6 numpy-1.21.5 overrides-3.1.0 pandas-1.1.5 pathvalidate-2.5.2 plac-1.1.3 py-rouge-1.1 pydantic-1.6.2 pytablewriter-0.64.2 s3transfer-0.3.7 sacremoses-0.0.53 scikit-learn-0.22.2.post1 sentencepiece-0.1.97 spacy-2.3.8 srsly-1.0.6 tabledata-1.3.0 tcolorpy-0.1.2 tensorboardX-2.5.1 thinc-7.4.6 tokenizers-0.9.2 torch-1.7.0 torchvision-0.8.1 transformers-3.4.0 typepy-1.3.0 urllib3-1.25.11 word2number-1.1\n", "Found existing installation: dataclasses 0.6\n", "Uninstalling dataclasses-0.6:\n", " Successfully uninstalled dataclasses-0.6\n", "Archive: data.zip\n", " creating: aste/data/\n", " creating: aste/data/triplet_data/\n", " creating: aste/data/triplet_data/14lap/\n", " inflating: aste/data/triplet_data/14lap/dev.txt \n", " inflating: aste/data/triplet_data/14lap/test.txt \n", " inflating: aste/data/triplet_data/14lap/train.txt \n", " creating: aste/data/triplet_data/14res/\n", " inflating: aste/data/triplet_data/14res/dev.txt \n", " inflating: aste/data/triplet_data/14res/test.txt \n", " inflating: aste/data/triplet_data/14res/train.txt \n", " creating: aste/data/triplet_data/15res/\n", " inflating: aste/data/triplet_data/15res/dev.txt \n", " inflating: aste/data/triplet_data/15res/test.txt \n", " inflating: aste/data/triplet_data/15res/train.txt \n", " creating: aste/data/triplet_data/16res/\n", " inflating: aste/data/triplet_data/16res/dev.txt \n", " inflating: aste/data/triplet_data/16res/test.txt \n", " inflating: aste/data/triplet_data/16res/train.txt \n" ] } ], "source": [ "!git clone https://github.com/chiayewken/Span-ASTE.git\n", "!cd Span-ASTE && git checkout f53ec3c\n", "!cp -a Span-ASTE/* .\n", "!echo boto3==1.16.46 >> requirements.txt\n", "!bash setup.sh" ] }, { "cell_type": "code", "execution_count": 2, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "-pTnCgDxcSQ5", "outputId": "a461cd5d-5ed6-4c38-9144-b4149ee62952" }, "outputs": [ { "output_type": "stream", "name": "stdout", "text": [ "tokens: ['I', 'charge', 'it', 'at', 'night', 'and', 'skip', 'taking', 'the', 'cord', 'with', 'me', 'because', 'of', 'the', 'good', 'battery', 'life', '.']\n", "target: (16, 17)\n", "opinion: (15, 15)\n", "label: LabelEnum.positive\n", "\n", "tokens: ['it', 'is', 'of', 'high', 'quality', ',', 'has', 'a', 'killer', 'GUI', ',', 'is', 'extremely', 'stable', ',', 'is', 'highly', 'expandable', ',', 'is', 'bundled', 'with', 'lots', 'of', 'very', 'good', 'applications', ',', 'is', 'easy', 'to', 'use', ',', 'and', 'is', 'absolutely', 'gorgeous', '.']\n", "target: (4, 4)\n", "opinion: (3, 3)\n", "label: LabelEnum.positive\n", "target: (9, 9)\n", "opinion: (8, 8)\n", "label: LabelEnum.positive\n", "target: (26, 26)\n", "opinion: (25, 25)\n", "label: LabelEnum.positive\n", "target: (31, 31)\n", "opinion: (29, 29)\n", "label: LabelEnum.positive\n", "\n", "tokens: ['Easy', 'to', 'start', 'up', 'and', 'does', 'not', 'overheat', 'as', 'much', 'as', 'other', 'laptops', '.']\n", "target: (2, 3)\n", "opinion: (0, 0)\n", "label: LabelEnum.positive\n", "\n" ] } ], "source": [ "#@title Data Exploration\n", "data_name = \"14lap\" #@param [\"14lap\", \"14res\", \"15res\", \"16res\"]\n", "\n", "import sys\n", "sys.path.append(\"aste\")\n", "from data_utils import Data\n", "\n", "path = f\"aste/data/triplet_data/{data_name}/train.txt\"\n", "data = Data.load_from_full_path(path)\n", "\n", "for s in data.sentences[:3]:\n", " print(\"tokens:\", s.tokens)\n", " for t in s.triples:\n", " print(\"target:\", (t.t_start, t.t_end))\n", " print(\"opinion:\", (t.o_start, t.o_end))\n", " print(\"label:\", t.label)\n", " print()" ] }, { "cell_type": "code", "source": [ "# Download pretrained SpanModel weights\n", "from pathlib import Path\n", "template = \"https://github.com/chiayewken/Span-ASTE/releases/download/v1.0.0/{}.tar\"\n", "url = template.format(data_name)\n", "model_tar = Path(url).name\n", "model_dir = Path(url).stem\n", "\n", "!wget -nc $url\n", "!tar -xf $model_tar" ], "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "id": "3LmrJekiPHpQ", "outputId": "0f62b4a9-8dd1-4363-b66f-1ae1661e6cab" }, "execution_count": 3, "outputs": [ { "output_type": "stream", "name": "stdout", "text": [ "--2022-11-30 07:39:51-- https://github.com/chiayewken/Span-ASTE/releases/download/v1.0.0/14lap.tar\n", "Resolving github.com (github.com)... 20.205.243.166\n", "Connecting to github.com (github.com)|20.205.243.166|:443... connected.\n", "HTTP request sent, awaiting response... 302 Found\n", "Location: https://objects.githubusercontent.com/github-production-release-asset-2e65be/371216048/70bb2013-2773-44c0-b0d9-8a2ec8e38515?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAIWNJYAX4CSVEH53A%2F20221130%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20221130T073951Z&X-Amz-Expires=300&X-Amz-Signature=10727051f65ed91031b2e1e8b05cf44384aae0bdafd0171b1655ca6c72249494&X-Amz-SignedHeaders=host&actor_id=0&key_id=0&repo_id=371216048&response-content-disposition=attachment%3B%20filename%3D14lap.tar&response-content-type=application%2Foctet-stream [following]\n", "--2022-11-30 07:39:51-- https://objects.githubusercontent.com/github-production-release-asset-2e65be/371216048/70bb2013-2773-44c0-b0d9-8a2ec8e38515?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAIWNJYAX4CSVEH53A%2F20221130%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20221130T073951Z&X-Amz-Expires=300&X-Amz-Signature=10727051f65ed91031b2e1e8b05cf44384aae0bdafd0171b1655ca6c72249494&X-Amz-SignedHeaders=host&actor_id=0&key_id=0&repo_id=371216048&response-content-disposition=attachment%3B%20filename%3D14lap.tar&response-content-type=application%2Foctet-stream\n", "Resolving objects.githubusercontent.com (objects.githubusercontent.com)... 185.199.108.133, 185.199.109.133, 185.199.110.133, ...\n", "Connecting to objects.githubusercontent.com (objects.githubusercontent.com)|185.199.108.133|:443... connected.\n", "HTTP request sent, awaiting response... 200 OK\n", "Length: 409068544 (390M) [application/octet-stream]\n", "Saving to: ‘14lap.tar’\n", "\n", "14lap.tar 100%[===================>] 390.12M 2.13MB/s in 2m 21s \n", "\n", "2022-11-30 07:42:13 (2.76 MB/s) - ‘14lap.tar’ saved [409068544/409068544]\n", "\n" ] } ] }, { "cell_type": "code", "execution_count": 4, "metadata": { "colab": { "base_uri": "https://localhost:8080/", "height": 488, "referenced_widgets": [ "f61ea767ae064779b77f7d206a90b765", "382e7815e6314a798943a7f71eab1dbd", "b3f970d5f20748d091d13d1d37e712e4", "3c925c25029e4e5a9515b525a819cb31", "17148c3a40ae4572923f16f249179b9b", "9cc1d9231ee34d33b65a88c4de3b213f", "9afa9b48d00748739422b2e32763e57d", "f6d16c6d56974ec88f55333b65e0f16a", "e776ac7bd605497395d6cf45648c46e0", "87d171d5ff4d48bea3781c4185c53cd3", "ac44150d1166470f944a1d0effeae80b", "916c3c664f2348b5b608c368090945ac", "f00d08843e1a4e9e911a8d9fd11f04d1", "de26b5b4f1be42cba2951f528f7715ba", "d5d290cde75d463ba7b9b220eed79ca7", "e30953017bae40849979501dbb4647bc", "08b2e55d6325474da282c48e0f959a56", "542e865145b547ffbe61dec7fb94bab7", "1ac6bf7c4d7d4fbd8d1c85ec426854db", "808d2ba240c241e9a6989a03c4134a33", "886551311e7d4ee9823ecd34dfc82811", "988ec5ae620d4d67b6749ee92a2cb560", "9463e5ed29e74f05869715f4669d1fa5", "5e57195d10d7414c9f418af4e7eca84a", "e4bb3941e21d45f2b2327690b4d589bf", "321f61ce086b4ace9260a2d55afbdefa", "94f8b1fb0c764cfa9af078bd238623d4", "621130d9d8cf468abe5709a85f07d106", "1453b743641b45758303e91bfedafe03", "a7aeaf582d15403dbe447d57789b691f", "d1d0b028b6c04d59ada3bdfb7efde504", "0a203635e4a54efd96b85633164a067d", "c55350fd925a454eae62f9da4ed21962", "21dd3d5e1468453ab2f81d5e184a990e", "a18149514fe94397abd4bcafd4df0807", "c73b50f20f5f4b6c8ccca8e1ec61e738", "fb17189f06074ca39d8251ea2ece15f3", "b379be7248c84e88b3a5bc8362e56e2f", "7e85b97fbf8642ecb7613a8b3646b6dc", "f13fd92805504c0dae5b22e404c256fa", "86c67fc1ac0d47bbace0fe3b6f24c7ce", "46568a6cac834c86854b6e41c7e7219a", "fd38ef9382a6488a8be23d5bdb1fb533", "e01ecdf66c3143809825cbbad4aaeebb" ] }, "id": "r3i4rnIhapWe", "outputId": "804a7c34-2089-4dab-b736-e2f92ba30f94" }, "outputs": [ { "output_type": "display_data", "data": { "text/plain": [ "Downloading: 0%| | 0.00/433 [00:00.make_feedforward at 0x7f26debbe680>, 'span_emb_dim': 1556, 'feature_size': 20, 'spans_per_word': 0.5, 'positive_label_weight': 1.0, 'regularizer': None, 'use_distance_embeds': True, 'use_pruning': True, 'kwargs': {}, 'vocab': Vocabulary with namespaces: None__relation_labels, Size: 3 || None__ner_labels, Size: 3 || Non Padded Namespaces: {'*tags', '*labels'}, '__class__': }}\n", "{'token_emb_dim': 768, 'span_emb_dim': 1556, 'relation_scorer_dim': 3240}\n", "{'relation_loss_fn': CrossEntropyLoss()}\n" ] }, { "output_type": "stream", "name": "stderr", "text": [ "reading instances: 1it [00:00, 350.58it/s]\n" ] }, { "output_type": "stream", "name": "stdout", "text": [ "\n", "{'target': 'Windows 8', 'opinion': 'Did not enjoy', 'sentiment': }\n", "\n", "{'target': 'touchscreen functions', 'opinion': 'Did not enjoy', 'sentiment': }\n", "\n", "{'target': 'Windows 8', 'opinion': 'new', 'sentiment': }\n" ] } ], "source": [ "# Use pretrained SpanModel weights for prediction\n", "import sys\n", "sys.path.append(\"aste\")\n", "from pathlib import Path\n", "from data_utils import Data, Sentence, SplitEnum\n", "from wrapper import SpanModel\n", "\n", "def predict_sentence(text: str, model: SpanModel) -> Sentence:\n", " path_in = \"temp_in.txt\"\n", " path_out = \"temp_out.txt\"\n", " sent = Sentence(tokens=text.split(), triples=[], pos=[], is_labeled=False, weight=1, id=0)\n", " data = Data(root=Path(), data_split=SplitEnum.test, sentences=[sent])\n", " data.save_to_path(path_in)\n", " model.predict(path_in, path_out)\n", " data = Data.load_from_full_path(path_out)\n", " return data.sentences[0]\n", "\n", "text = \"Did not enjoy the new Windows 8 and touchscreen functions .\"\n", "model = SpanModel(save_dir=model_dir, random_seed=0)\n", "sent = predict_sentence(text, model)\n", "\n", "for t in sent.triples:\n", " target = \" \".join(sent.tokens[t.t_start:t.t_end+1])\n", " opinion = \" \".join(sent.tokens[t.o_start:t.o_end+1])\n", " print()\n", " print(dict(target=target, opinion=opinion, sentiment=t.label))" ] }, { "cell_type": "code", "execution_count": null, "metadata": { "colab": { "base_uri": "https://localhost:8080/" }, "collapsed": true, "id": "srSNwqUz-39x", "outputId": "9a34cc00-477f-4002-c8ec-e357284c2bc5" }, "outputs": [ { "output_type": "stream", "name": "stdout", "text": [ "{'weights_dir': PosixPath('outputs/14lap/seed_4/weights')}\n", "2022-11-30 03:01:13,590 - INFO - allennlp.common.params - random_seed = 4\n", "2022-11-30 03:01:13,592 - INFO - allennlp.common.params - numpy_seed = 4\n", "2022-11-30 03:01:13,596 - INFO - allennlp.common.params - pytorch_seed = 4\n", "2022-11-30 03:01:13,599 - INFO - allennlp.common.checks - Pytorch version: 1.7.0\n", "2022-11-30 03:01:13,600 - INFO - allennlp.common.params - type = default\n", "2022-11-30 03:01:13,604 - INFO - allennlp.common.params - dataset_reader.type = span_model\n", "2022-11-30 03:01:13,606 - INFO - allennlp.common.params - dataset_reader.lazy = False\n", "2022-11-30 03:01:13,608 - INFO - allennlp.common.params - dataset_reader.cache_directory = None\n", "2022-11-30 03:01:13,610 - INFO - allennlp.common.params - dataset_reader.max_instances = None\n", "2022-11-30 03:01:13,612 - INFO - allennlp.common.params - dataset_reader.manual_distributed_sharding = False\n", "2022-11-30 03:01:13,613 - INFO - allennlp.common.params - dataset_reader.manual_multi_process_sharding = False\n", "2022-11-30 03:01:13,615 - INFO - allennlp.common.params - dataset_reader.max_span_width = 8\n", "2022-11-30 03:01:13,617 - INFO - allennlp.common.params - dataset_reader.token_indexers.bert.type = pretrained_transformer_mismatched\n", "2022-11-30 03:01:13,618 - INFO - allennlp.common.params - dataset_reader.token_indexers.bert.token_min_padding_length = 0\n", "2022-11-30 03:01:13,620 - INFO - allennlp.common.params - dataset_reader.token_indexers.bert.model_name = bert-base-uncased\n", "2022-11-30 03:01:13,621 - INFO - allennlp.common.params - dataset_reader.token_indexers.bert.namespace = tags\n", "2022-11-30 03:01:13,623 - INFO - allennlp.common.params - dataset_reader.token_indexers.bert.max_length = 512\n", "2022-11-30 03:01:13,625 - INFO - allennlp.common.params - dataset_reader.token_indexers.bert.tokenizer_kwargs = None\n", "################################################################################\n", "2022-11-30 03:01:13,627 - INFO - allennlp.common.params - train_data_path = /content/outputs/14lap/seed_4/temp_data/train.json\n", "2022-11-30 03:01:13,630 - INFO - allennlp.common.params - vocabulary = \n", "2022-11-30 03:01:13,631 - INFO - allennlp.common.params - datasets_for_vocab_creation = None\n", "2022-11-30 03:01:13,633 - INFO - allennlp.common.params - validation_dataset_reader = None\n", "2022-11-30 03:01:13,634 - INFO - allennlp.common.params - validation_data_path = /content/outputs/14lap/seed_4/temp_data/dev.json\n", "2022-11-30 03:01:13,636 - INFO - allennlp.common.params - validation_data_loader = None\n", "2022-11-30 03:01:13,637 - INFO - allennlp.common.params - test_data_path = /content/outputs/14lap/seed_4/temp_data/dev.json\n", "2022-11-30 03:01:13,639 - INFO - allennlp.common.params - evaluate_on_test = False\n", "2022-11-30 03:01:13,640 - INFO - allennlp.common.params - batch_weight_key = \n", "2022-11-30 03:01:13,642 - INFO - allennlp.training.util - Reading training data from /content/outputs/14lap/seed_4/temp_data/train.json\n" ] }, { "output_type": "stream", "name": "stderr", "text": [ "reading instances: 906it [00:01, 803.93it/s]" ] }, { "output_type": "stream", "name": "stdout", "text": [ "2022-11-30 03:01:14,774 - INFO - allennlp.training.util - Reading validation data from /content/outputs/14lap/seed_4/temp_data/dev.json\n" ] }, { "output_type": "stream", "name": "stderr", "text": [ "\n", "reading instances: 219it [00:00, 1307.35it/s]" ] }, { "output_type": "stream", "name": "stdout", "text": [ "2022-11-30 03:01:14,953 - INFO - allennlp.training.util - Reading test data from /content/outputs/14lap/seed_4/temp_data/dev.json\n" ] }, { "output_type": "stream", "name": "stderr", "text": [ "\n", "reading instances: 219it [00:00, 520.69it/s]" ] }, { "output_type": "stream", "name": "stdout", "text": [ "2022-11-30 03:01:15,382 - INFO - allennlp.common.params - type = from_instances\n", "2022-11-30 03:01:15,386 - INFO - allennlp.common.params - min_count = None\n", "2022-11-30 03:01:15,389 - INFO - allennlp.common.params - max_vocab_size = None\n", "2022-11-30 03:01:15,391 - INFO - allennlp.common.params - non_padded_namespaces = ('*tags', '*labels')\n", "2022-11-30 03:01:15,394 - INFO - allennlp.common.params - pretrained_files = None\n", "2022-11-30 03:01:15,397 - INFO - allennlp.common.params - only_include_pretrained_words = False\n", "2022-11-30 03:01:15,401 - INFO - allennlp.common.params - tokens_to_add = None\n", "2022-11-30 03:01:15,402 - INFO - allennlp.common.params - min_pretrained_embeddings = None\n", "2022-11-30 03:01:15,403 - INFO - allennlp.common.params - padding_token = @@PADDING@@\n", "2022-11-30 03:01:15,405 - INFO - allennlp.common.params - oov_token = @@UNKNOWN@@\n", "2022-11-30 03:01:15,406 - INFO - allennlp.data.vocabulary - Fitting token dictionary from dataset.\n" ] }, { "output_type": "stream", "name": "stderr", "text": [ "\n", "building vocab: 1344it [00:00, 14370.57it/s]" ] }, { "output_type": "stream", "name": "stdout", "text": [ "2022-11-30 03:01:15,504 - INFO - allennlp.common.params - model.type = span_model\n", "2022-11-30 03:01:15,507 - INFO - allennlp.common.params - model.regularizer = None\n", "2022-11-30 03:01:15,513 - INFO - allennlp.common.params - model.embedder.type = basic\n", "2022-11-30 03:01:15,515 - INFO - allennlp.common.params - model.embedder.token_embedders.bert.type = pretrained_transformer_mismatched\n", "2022-11-30 03:01:15,517 - INFO - allennlp.common.params - model.embedder.token_embedders.bert.model_name = bert-base-uncased\n", "2022-11-30 03:01:15,519 - INFO - allennlp.common.params - model.embedder.token_embedders.bert.max_length = 512\n", "2022-11-30 03:01:15,520 - INFO - allennlp.common.params - model.embedder.token_embedders.bert.train_parameters = True\n", "2022-11-30 03:01:15,521 - INFO - allennlp.common.params - model.embedder.token_embedders.bert.last_layer_only = True\n", "2022-11-30 03:01:15,523 - INFO - allennlp.common.params - model.embedder.token_embedders.bert.gradient_checkpointing = None\n" ] }, { "output_type": "stream", "name": "stderr", "text": [ "\n" ] }, { "output_type": "stream", "name": "stdout", "text": [ "2022-11-30 03:01:15,525 - INFO - allennlp.common.params - model.embedder.token_embedders.bert.tokenizer_kwargs = None\n", "2022-11-30 03:01:15,526 - INFO - allennlp.common.params - model.embedder.token_embedders.bert.transformer_kwargs = None\n", "2022-11-30 03:01:15,653 - INFO - allennlp.common.params - model.modules.relation.spans_per_word = 0.5\n", "2022-11-30 03:01:15,654 - INFO - allennlp.common.params - model.modules.relation.use_distance_embeds = True\n", "2022-11-30 03:01:15,657 - INFO - allennlp.common.params - model.modules.relation.use_pruning = True\n", "2022-11-30 03:01:15,658 - INFO - allennlp.common.params - model.feature_size = 20\n", "2022-11-30 03:01:15,659 - INFO - allennlp.common.params - model.max_span_width = 8\n", "2022-11-30 03:01:15,660 - INFO - allennlp.common.params - model.target_task = relation\n", "2022-11-30 03:01:15,663 - INFO - allennlp.common.params - model.initializer.regexes.0.1.type = xavier_normal\n", "2022-11-30 03:01:15,665 - INFO - allennlp.common.params - model.initializer.regexes.0.1.gain = 1.0\n", "2022-11-30 03:01:15,667 - INFO - allennlp.common.params - model.initializer.prevent_regexes = None\n", "2022-11-30 03:01:15,669 - INFO - allennlp.common.params - model.module_initializer.regexes.0.1.type = xavier_normal\n", "2022-11-30 03:01:15,670 - INFO - allennlp.common.params - model.module_initializer.regexes.0.1.gain = 1.0\n", "2022-11-30 03:01:15,672 - INFO - allennlp.common.params - model.module_initializer.regexes.1.1.type = xavier_normal\n", "2022-11-30 03:01:15,673 - INFO - allennlp.common.params - model.module_initializer.regexes.1.1.gain = 1.0\n", "2022-11-30 03:01:15,674 - INFO - allennlp.common.params - model.module_initializer.prevent_regexes = None\n", "2022-11-30 03:01:15,676 - INFO - allennlp.common.params - model.display_metrics = None\n", "2022-11-30 03:01:15,677 - INFO - allennlp.common.params - model.span_extractor_type = endpoint\n", "2022-11-30 03:01:15,678 - INFO - allennlp.common.params - model.use_span_width_embeds = True\n", "{'span_model_unused_keys': dict_keys(['serialization_dir'])}\n", "{'locals': ('span_extractor_type', 'endpoint')}\n", "{'locals': ('use_span_width_embeds', True)}\n", "2022-11-30 03:01:15,680 - INFO - allennlp.common.params - ner.regularizer = None\n", "2022-11-30 03:01:15,681 - INFO - allennlp.common.params - ner.name = ner_labels\n", "{'ner_loss_fn': CrossEntropyLoss()}\n", "2022-11-30 03:01:15,687 - INFO - allennlp.common.params - relation.regularizer = None\n", "2022-11-30 03:01:15,688 - INFO - allennlp.common.params - relation.serialization_dir = None\n", "2022-11-30 03:01:15,689 - INFO - allennlp.common.params - relation.spans_per_word = 0.5\n", "2022-11-30 03:01:15,690 - INFO - allennlp.common.params - relation.positive_label_weight = 1.0\n", "2022-11-30 03:01:15,692 - INFO - allennlp.common.params - relation.use_distance_embeds = True\n", "2022-11-30 03:01:15,693 - INFO - allennlp.common.params - relation.use_pruning = True\n", "{'unused_keys': dict_keys([])}\n", "{'locals': {'self': ProperRelationExtractor(), 'make_feedforward': .make_feedforward at 0x7f95ec5935f0>, 'span_emb_dim': 1556, 'feature_size': 20, 'spans_per_word': 0.5, 'positive_label_weight': 1.0, 'regularizer': None, 'use_distance_embeds': True, 'use_pruning': True, 'kwargs': {}, 'vocab': Vocabulary with namespaces: None__ner_labels, Size: 3 || None__relation_labels, Size: 3 || Non Padded Namespaces: {'*labels', '*tags'}, '__class__': }}\n", "{'token_emb_dim': 768, 'span_emb_dim': 1556, 'relation_scorer_dim': 3240}\n", "{'relation_loss_fn': CrossEntropyLoss()}\n", "2022-11-30 03:01:15,722 - INFO - allennlp.nn.initializers - Initializing parameters\n", "2022-11-30 03:01:15,727 - INFO - allennlp.nn.initializers - Initializing _ner_scorers.None__ner_labels.0._module._linear_layers.0.weight using .*weight initializer\n", "2022-11-30 03:01:15,733 - INFO - allennlp.nn.initializers - Initializing _ner_scorers.None__ner_labels.0._module._linear_layers.1.weight using .*weight initializer\n", "2022-11-30 03:01:15,743 - INFO - allennlp.nn.initializers - Initializing _ner_scorers.None__ner_labels.1._module.weight using .*weight initializer\n", "2022-11-30 03:01:15,745 - WARNING - allennlp.nn.initializers - Did not use initialization regex that was passed: .*weight_matrix\n", "2022-11-30 03:01:15,746 - INFO - allennlp.nn.initializers - Done initializing parameters; the following parameters are using their default initialization from their code\n", "2022-11-30 03:01:15,748 - INFO - allennlp.nn.initializers - _ner_scorers.None__ner_labels.0._module._linear_layers.0.bias\n", "2022-11-30 03:01:15,749 - INFO - allennlp.nn.initializers - _ner_scorers.None__ner_labels.0._module._linear_layers.1.bias\n", "2022-11-30 03:01:15,750 - INFO - allennlp.nn.initializers - _ner_scorers.None__ner_labels.1._module.bias\n", "2022-11-30 03:01:15,752 - INFO - allennlp.nn.initializers - Initializing parameters\n", "2022-11-30 03:01:15,753 - INFO - allennlp.nn.initializers - Initializing d_embedder.embedder.weight using .*weight initializer\n", "2022-11-30 03:01:15,754 - INFO - allennlp.nn.initializers - Initializing _relation_feedforwards.None__relation_labels._linear_layers.0.weight using .*weight initializer\n", "2022-11-30 03:01:15,781 - INFO - allennlp.nn.initializers - Initializing _relation_feedforwards.None__relation_labels._linear_layers.1.weight using .*weight initializer\n", "2022-11-30 03:01:15,783 - INFO - allennlp.nn.initializers - Initializing _relation_scorers.None__relation_labels.weight using .*weight initializer\n", "2022-11-30 03:01:15,787 - WARNING - allennlp.nn.initializers - Did not use initialization regex that was passed: .*weight_matrix\n", "2022-11-30 03:01:15,789 - INFO - allennlp.nn.initializers - Done initializing parameters; the following parameters are using their default initialization from their code\n", "2022-11-30 03:01:15,791 - INFO - allennlp.nn.initializers - _relation_feedforwards.None__relation_labels._linear_layers.0.bias\n", "2022-11-30 03:01:15,794 - INFO - allennlp.nn.initializers - _relation_feedforwards.None__relation_labels._linear_layers.1.bias\n", "2022-11-30 03:01:15,797 - INFO - allennlp.nn.initializers - _relation_scorers.None__relation_labels.bias\n", "2022-11-30 03:01:15,799 - INFO - allennlp.nn.initializers - Initializing parameters\n", "2022-11-30 03:01:15,802 - INFO - allennlp.nn.initializers - Initializing _endpoint_span_extractor._span_width_embedding.weight using _span_width_embedding.weight initializer\n", "2022-11-30 03:01:15,806 - INFO - allennlp.nn.initializers - Done initializing parameters; the following parameters are using their default initialization from their code\n", "2022-11-30 03:01:15,809 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.LayerNorm.bias\n", "2022-11-30 03:01:15,811 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.LayerNorm.weight\n", "2022-11-30 03:01:15,813 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.position_embeddings.weight\n", "2022-11-30 03:01:15,815 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.token_type_embeddings.weight\n", "2022-11-30 03:01:15,818 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.word_embeddings.weight\n", "2022-11-30 03:01:15,820 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:15,822 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:15,823 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.output.dense.bias\n", "2022-11-30 03:01:15,824 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.output.dense.weight\n", "2022-11-30 03:01:15,829 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.key.bias\n", "2022-11-30 03:01:15,831 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.key.weight\n", "2022-11-30 03:01:15,832 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.query.bias\n", "2022-11-30 03:01:15,833 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.query.weight\n", "2022-11-30 03:01:15,834 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.value.bias\n", "2022-11-30 03:01:15,837 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.value.weight\n", "2022-11-30 03:01:15,838 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.intermediate.dense.bias\n", "2022-11-30 03:01:15,839 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.intermediate.dense.weight\n", "2022-11-30 03:01:15,841 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.output.LayerNorm.bias\n", "2022-11-30 03:01:15,844 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.output.LayerNorm.weight\n", "2022-11-30 03:01:15,845 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.output.dense.bias\n", "2022-11-30 03:01:15,847 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.output.dense.weight\n", "2022-11-30 03:01:15,849 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:15,850 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:15,851 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.output.dense.bias\n", "2022-11-30 03:01:15,853 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.output.dense.weight\n", "2022-11-30 03:01:15,855 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.key.bias\n", "2022-11-30 03:01:15,857 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.key.weight\n", "2022-11-30 03:01:15,859 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.query.bias\n", "2022-11-30 03:01:15,862 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.query.weight\n", "2022-11-30 03:01:15,864 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.value.bias\n", "2022-11-30 03:01:15,868 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.value.weight\n", "2022-11-30 03:01:15,871 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.intermediate.dense.bias\n", "2022-11-30 03:01:15,873 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.intermediate.dense.weight\n", "2022-11-30 03:01:15,875 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.output.LayerNorm.bias\n", "2022-11-30 03:01:15,877 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.output.LayerNorm.weight\n", "2022-11-30 03:01:15,880 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.output.dense.bias\n", "2022-11-30 03:01:15,882 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.output.dense.weight\n", "2022-11-30 03:01:15,884 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:15,886 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:15,888 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.output.dense.bias\n", "2022-11-30 03:01:15,889 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.output.dense.weight\n", "2022-11-30 03:01:15,891 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.key.bias\n", "2022-11-30 03:01:15,893 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.key.weight\n", "2022-11-30 03:01:15,894 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.query.bias\n", "2022-11-30 03:01:15,896 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.query.weight\n", "2022-11-30 03:01:15,897 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.value.bias\n", "2022-11-30 03:01:15,899 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.value.weight\n", "2022-11-30 03:01:15,900 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.intermediate.dense.bias\n", "2022-11-30 03:01:15,901 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.intermediate.dense.weight\n", "2022-11-30 03:01:15,903 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.output.LayerNorm.bias\n", "2022-11-30 03:01:15,904 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.output.LayerNorm.weight\n", "2022-11-30 03:01:15,905 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.output.dense.bias\n", "2022-11-30 03:01:15,906 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.output.dense.weight\n", "2022-11-30 03:01:15,908 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:15,909 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:15,910 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.output.dense.bias\n", "2022-11-30 03:01:15,912 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.output.dense.weight\n", "2022-11-30 03:01:15,913 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.key.bias\n", "2022-11-30 03:01:15,915 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.key.weight\n", "2022-11-30 03:01:15,916 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.query.bias\n", "2022-11-30 03:01:15,917 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.query.weight\n", "2022-11-30 03:01:15,919 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.value.bias\n", "2022-11-30 03:01:15,920 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.value.weight\n", "2022-11-30 03:01:15,922 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.intermediate.dense.bias\n", "2022-11-30 03:01:15,923 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.intermediate.dense.weight\n", "2022-11-30 03:01:15,924 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.output.LayerNorm.bias\n", "2022-11-30 03:01:15,926 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.output.LayerNorm.weight\n", "2022-11-30 03:01:15,928 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.output.dense.bias\n", "2022-11-30 03:01:15,929 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.output.dense.weight\n", "2022-11-30 03:01:15,930 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:15,931 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:15,933 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.output.dense.bias\n", "2022-11-30 03:01:15,934 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.output.dense.weight\n", "2022-11-30 03:01:15,935 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.key.bias\n", "2022-11-30 03:01:15,936 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.key.weight\n", "2022-11-30 03:01:15,937 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.query.bias\n", "2022-11-30 03:01:15,938 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.query.weight\n", "2022-11-30 03:01:15,940 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.value.bias\n", "2022-11-30 03:01:15,941 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.value.weight\n", "2022-11-30 03:01:15,942 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.intermediate.dense.bias\n", "2022-11-30 03:01:15,943 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.intermediate.dense.weight\n", "2022-11-30 03:01:15,945 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.output.LayerNorm.bias\n", "2022-11-30 03:01:15,946 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.output.LayerNorm.weight\n", "2022-11-30 03:01:15,947 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.output.dense.bias\n", "2022-11-30 03:01:15,948 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.output.dense.weight\n", "2022-11-30 03:01:15,950 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:15,951 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:15,952 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.output.dense.bias\n", "2022-11-30 03:01:15,954 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.output.dense.weight\n", "2022-11-30 03:01:15,955 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.key.bias\n", "2022-11-30 03:01:15,956 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.key.weight\n", "2022-11-30 03:01:15,958 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.query.bias\n", "2022-11-30 03:01:15,959 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.query.weight\n", "2022-11-30 03:01:15,960 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.value.bias\n", "2022-11-30 03:01:15,961 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.value.weight\n", "2022-11-30 03:01:15,963 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.intermediate.dense.bias\n", "2022-11-30 03:01:15,964 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.intermediate.dense.weight\n", "2022-11-30 03:01:15,965 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.output.LayerNorm.bias\n", "2022-11-30 03:01:15,967 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.output.LayerNorm.weight\n", "2022-11-30 03:01:15,968 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.output.dense.bias\n", "2022-11-30 03:01:15,969 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.output.dense.weight\n", "2022-11-30 03:01:15,970 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:15,972 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:15,973 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.output.dense.bias\n", "2022-11-30 03:01:15,974 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.output.dense.weight\n", "2022-11-30 03:01:15,976 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.key.bias\n", "2022-11-30 03:01:15,977 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.key.weight\n", "2022-11-30 03:01:15,978 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.query.bias\n", "2022-11-30 03:01:15,980 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.query.weight\n", "2022-11-30 03:01:15,981 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.value.bias\n", "2022-11-30 03:01:15,982 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.value.weight\n", "2022-11-30 03:01:15,983 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.intermediate.dense.bias\n", "2022-11-30 03:01:15,985 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.intermediate.dense.weight\n", "2022-11-30 03:01:15,986 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.output.LayerNorm.bias\n", "2022-11-30 03:01:15,987 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.output.LayerNorm.weight\n", "2022-11-30 03:01:15,989 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.output.dense.bias\n", "2022-11-30 03:01:15,990 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.output.dense.weight\n", "2022-11-30 03:01:15,991 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:15,993 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:15,994 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.output.dense.bias\n", "2022-11-30 03:01:15,995 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.output.dense.weight\n", "2022-11-30 03:01:15,996 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.key.bias\n", "2022-11-30 03:01:15,998 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.key.weight\n", "2022-11-30 03:01:15,999 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.query.bias\n", "2022-11-30 03:01:16,000 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.query.weight\n", "2022-11-30 03:01:16,002 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.value.bias\n", "2022-11-30 03:01:16,003 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.value.weight\n", "2022-11-30 03:01:16,004 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.intermediate.dense.bias\n", "2022-11-30 03:01:16,006 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.intermediate.dense.weight\n", "2022-11-30 03:01:16,007 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.output.LayerNorm.bias\n", "2022-11-30 03:01:16,008 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.output.LayerNorm.weight\n", "2022-11-30 03:01:16,010 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.output.dense.bias\n", "2022-11-30 03:01:16,011 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.output.dense.weight\n", "2022-11-30 03:01:16,012 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,014 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,015 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.output.dense.bias\n", "2022-11-30 03:01:16,016 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.output.dense.weight\n", "2022-11-30 03:01:16,018 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.key.bias\n", "2022-11-30 03:01:16,019 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.key.weight\n", "2022-11-30 03:01:16,020 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.query.bias\n", "2022-11-30 03:01:16,021 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.query.weight\n", "2022-11-30 03:01:16,022 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.value.bias\n", "2022-11-30 03:01:16,023 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.value.weight\n", "2022-11-30 03:01:16,024 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.intermediate.dense.bias\n", "2022-11-30 03:01:16,025 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.intermediate.dense.weight\n", "2022-11-30 03:01:16,026 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.output.LayerNorm.bias\n", "2022-11-30 03:01:16,028 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.output.LayerNorm.weight\n", "2022-11-30 03:01:16,029 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.output.dense.bias\n", "2022-11-30 03:01:16,030 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.output.dense.weight\n", "2022-11-30 03:01:16,031 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,033 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,034 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.output.dense.bias\n", "2022-11-30 03:01:16,035 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.output.dense.weight\n", "2022-11-30 03:01:16,037 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.key.bias\n", "2022-11-30 03:01:16,038 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.key.weight\n", "2022-11-30 03:01:16,039 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.query.bias\n", "2022-11-30 03:01:16,041 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.query.weight\n", "2022-11-30 03:01:16,042 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.value.bias\n", "2022-11-30 03:01:16,043 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.value.weight\n", "2022-11-30 03:01:16,045 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.intermediate.dense.bias\n", "2022-11-30 03:01:16,046 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.intermediate.dense.weight\n", "2022-11-30 03:01:16,047 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.output.LayerNorm.bias\n", "2022-11-30 03:01:16,049 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.output.LayerNorm.weight\n", "2022-11-30 03:01:16,050 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.output.dense.bias\n", "2022-11-30 03:01:16,051 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.output.dense.weight\n", "2022-11-30 03:01:16,052 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,054 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,055 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.output.dense.bias\n", "2022-11-30 03:01:16,056 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.output.dense.weight\n", "2022-11-30 03:01:16,058 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.key.bias\n", "2022-11-30 03:01:16,059 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.key.weight\n", "2022-11-30 03:01:16,060 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.query.bias\n", "2022-11-30 03:01:16,061 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.query.weight\n", "2022-11-30 03:01:16,063 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.value.bias\n", "2022-11-30 03:01:16,064 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.value.weight\n", "2022-11-30 03:01:16,065 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.intermediate.dense.bias\n", "2022-11-30 03:01:16,067 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.intermediate.dense.weight\n", "2022-11-30 03:01:16,068 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.output.LayerNorm.bias\n", "2022-11-30 03:01:16,069 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.output.LayerNorm.weight\n", "2022-11-30 03:01:16,070 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.output.dense.bias\n", "2022-11-30 03:01:16,072 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.output.dense.weight\n", "2022-11-30 03:01:16,073 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,074 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,076 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.output.dense.bias\n", "2022-11-30 03:01:16,077 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.output.dense.weight\n", "2022-11-30 03:01:16,078 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.key.bias\n", "2022-11-30 03:01:16,080 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.key.weight\n", "2022-11-30 03:01:16,081 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.query.bias\n", "2022-11-30 03:01:16,082 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.query.weight\n", "2022-11-30 03:01:16,083 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.value.bias\n", "2022-11-30 03:01:16,085 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.value.weight\n", "2022-11-30 03:01:16,086 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.intermediate.dense.bias\n", "2022-11-30 03:01:16,087 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.intermediate.dense.weight\n", "2022-11-30 03:01:16,089 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.output.LayerNorm.bias\n", "2022-11-30 03:01:16,090 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.output.LayerNorm.weight\n", "2022-11-30 03:01:16,091 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.output.dense.bias\n", "2022-11-30 03:01:16,093 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.output.dense.weight\n", "2022-11-30 03:01:16,094 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.pooler.dense.bias\n", "2022-11-30 03:01:16,095 - INFO - allennlp.nn.initializers - _embedder.token_embedder_bert._matched_embedder.transformer_model.pooler.dense.weight\n", "2022-11-30 03:01:16,097 - INFO - allennlp.nn.initializers - _ner._ner_scorers.None__ner_labels.0._module._linear_layers.0.bias\n", "2022-11-30 03:01:16,098 - INFO - allennlp.nn.initializers - _ner._ner_scorers.None__ner_labels.0._module._linear_layers.0.weight\n", "2022-11-30 03:01:16,099 - INFO - allennlp.nn.initializers - _ner._ner_scorers.None__ner_labels.0._module._linear_layers.1.bias\n", "2022-11-30 03:01:16,100 - INFO - allennlp.nn.initializers - _ner._ner_scorers.None__ner_labels.0._module._linear_layers.1.weight\n", "2022-11-30 03:01:16,102 - INFO - allennlp.nn.initializers - _ner._ner_scorers.None__ner_labels.1._module.bias\n", "2022-11-30 03:01:16,103 - INFO - allennlp.nn.initializers - _ner._ner_scorers.None__ner_labels.1._module.weight\n", "2022-11-30 03:01:16,104 - INFO - allennlp.nn.initializers - _relation._relation_feedforwards.None__relation_labels._linear_layers.0.bias\n", "2022-11-30 03:01:16,105 - INFO - allennlp.nn.initializers - _relation._relation_feedforwards.None__relation_labels._linear_layers.0.weight\n", "2022-11-30 03:01:16,107 - INFO - allennlp.nn.initializers - _relation._relation_feedforwards.None__relation_labels._linear_layers.1.bias\n", "2022-11-30 03:01:16,108 - INFO - allennlp.nn.initializers - _relation._relation_feedforwards.None__relation_labels._linear_layers.1.weight\n", "2022-11-30 03:01:16,109 - INFO - allennlp.nn.initializers - _relation._relation_scorers.None__relation_labels.bias\n", "2022-11-30 03:01:16,111 - INFO - allennlp.nn.initializers - _relation._relation_scorers.None__relation_labels.weight\n", "2022-11-30 03:01:16,112 - INFO - allennlp.nn.initializers - _relation.d_embedder.embedder.weight\n", "2022-11-30 03:01:16,113 - INFO - filelock - Lock 140284684846864 acquired on outputs/14lap/seed_4/weights/vocabulary/.lock\n", "2022-11-30 03:01:16,115 - INFO - filelock - Lock 140284684846864 released on outputs/14lap/seed_4/weights/vocabulary/.lock\n", "2022-11-30 03:01:16,116 - INFO - allennlp.common.params - data_loader.type = pytorch_dataloader\n", "2022-11-30 03:01:16,118 - INFO - allennlp.common.params - data_loader.batch_size = 1\n", "2022-11-30 03:01:16,119 - INFO - allennlp.common.params - data_loader.shuffle = False\n", "2022-11-30 03:01:16,120 - INFO - allennlp.common.params - data_loader.batch_sampler = None\n", "2022-11-30 03:01:16,122 - INFO - allennlp.common.params - data_loader.num_workers = 0\n", "2022-11-30 03:01:16,123 - INFO - allennlp.common.params - data_loader.pin_memory = False\n", "2022-11-30 03:01:16,124 - INFO - allennlp.common.params - data_loader.drop_last = False\n", "2022-11-30 03:01:16,125 - INFO - allennlp.common.params - data_loader.timeout = 0\n", "2022-11-30 03:01:16,127 - INFO - allennlp.common.params - data_loader.worker_init_fn = None\n", "2022-11-30 03:01:16,128 - INFO - allennlp.common.params - data_loader.multiprocessing_context = None\n", "2022-11-30 03:01:16,129 - INFO - allennlp.common.params - data_loader.batches_per_epoch = None\n", "2022-11-30 03:01:16,131 - INFO - allennlp.common.params - data_loader.sampler.type = random\n", "2022-11-30 03:01:16,132 - INFO - allennlp.common.params - data_loader.sampler.replacement = False\n", "2022-11-30 03:01:16,134 - INFO - allennlp.common.params - data_loader.sampler.num_samples = None\n", "2022-11-30 03:01:16,136 - INFO - allennlp.common.params - data_loader.type = pytorch_dataloader\n", "2022-11-30 03:01:16,137 - INFO - allennlp.common.params - data_loader.batch_size = 1\n", "2022-11-30 03:01:16,139 - INFO - allennlp.common.params - data_loader.shuffle = False\n", "2022-11-30 03:01:16,140 - INFO - allennlp.common.params - data_loader.batch_sampler = None\n", "2022-11-30 03:01:16,142 - INFO - allennlp.common.params - data_loader.num_workers = 0\n", "2022-11-30 03:01:16,143 - INFO - allennlp.common.params - data_loader.pin_memory = False\n", "2022-11-30 03:01:16,144 - INFO - allennlp.common.params - data_loader.drop_last = False\n", "2022-11-30 03:01:16,146 - INFO - allennlp.common.params - data_loader.timeout = 0\n", "2022-11-30 03:01:16,147 - INFO - allennlp.common.params - data_loader.worker_init_fn = None\n", "2022-11-30 03:01:16,148 - INFO - allennlp.common.params - data_loader.multiprocessing_context = None\n", "2022-11-30 03:01:16,149 - INFO - allennlp.common.params - data_loader.batches_per_epoch = None\n", "2022-11-30 03:01:16,151 - INFO - allennlp.common.params - data_loader.sampler.type = random\n", "2022-11-30 03:01:16,152 - INFO - allennlp.common.params - data_loader.sampler.replacement = False\n", "2022-11-30 03:01:16,154 - INFO - allennlp.common.params - data_loader.sampler.num_samples = None\n", "2022-11-30 03:01:16,155 - INFO - allennlp.common.params - data_loader.type = pytorch_dataloader\n", "2022-11-30 03:01:16,157 - INFO - allennlp.common.params - data_loader.batch_size = 1\n", "2022-11-30 03:01:16,158 - INFO - allennlp.common.params - data_loader.shuffle = False\n", "2022-11-30 03:01:16,160 - INFO - allennlp.common.params - data_loader.batch_sampler = None\n", "2022-11-30 03:01:16,161 - INFO - allennlp.common.params - data_loader.num_workers = 0\n", "2022-11-30 03:01:16,162 - INFO - allennlp.common.params - data_loader.pin_memory = False\n", "2022-11-30 03:01:16,164 - INFO - allennlp.common.params - data_loader.drop_last = False\n", "2022-11-30 03:01:16,165 - INFO - allennlp.common.params - data_loader.timeout = 0\n", "2022-11-30 03:01:16,167 - INFO - allennlp.common.params - data_loader.worker_init_fn = None\n", "2022-11-30 03:01:16,168 - INFO - allennlp.common.params - data_loader.multiprocessing_context = None\n", "2022-11-30 03:01:16,169 - INFO - allennlp.common.params - data_loader.batches_per_epoch = None\n", "2022-11-30 03:01:16,171 - INFO - allennlp.common.params - data_loader.sampler.type = random\n", "2022-11-30 03:01:16,172 - INFO - allennlp.common.params - data_loader.sampler.replacement = False\n", "2022-11-30 03:01:16,173 - INFO - allennlp.common.params - data_loader.sampler.num_samples = None\n", "2022-11-30 03:01:16,175 - INFO - allennlp.common.params - trainer.type = gradient_descent\n", "2022-11-30 03:01:16,177 - INFO - allennlp.common.params - trainer.patience = None\n", "2022-11-30 03:01:16,178 - INFO - allennlp.common.params - trainer.validation_metric = +MEAN__relation_f1\n", "2022-11-30 03:01:16,179 - INFO - allennlp.common.params - trainer.num_epochs = 10\n", "2022-11-30 03:01:16,181 - INFO - allennlp.common.params - trainer.cuda_device = 0\n", "2022-11-30 03:01:16,182 - INFO - allennlp.common.params - trainer.grad_norm = 5\n", "2022-11-30 03:01:16,184 - INFO - allennlp.common.params - trainer.grad_clipping = None\n", "2022-11-30 03:01:16,185 - INFO - allennlp.common.params - trainer.distributed = False\n", "2022-11-30 03:01:16,186 - INFO - allennlp.common.params - trainer.world_size = 1\n", "2022-11-30 03:01:16,188 - INFO - allennlp.common.params - trainer.num_gradient_accumulation_steps = 1\n", "2022-11-30 03:01:16,189 - INFO - allennlp.common.params - trainer.use_amp = False\n", "2022-11-30 03:01:16,191 - INFO - allennlp.common.params - trainer.no_grad = None\n", "2022-11-30 03:01:16,192 - INFO - allennlp.common.params - trainer.momentum_scheduler = None\n", "2022-11-30 03:01:16,194 - INFO - allennlp.common.params - trainer.tensorboard_writer = \n", "2022-11-30 03:01:16,195 - INFO - allennlp.common.params - trainer.moving_average = None\n", "2022-11-30 03:01:16,196 - INFO - allennlp.common.params - trainer.batch_callbacks = None\n", "2022-11-30 03:01:16,198 - INFO - allennlp.common.params - trainer.epoch_callbacks = None\n", "2022-11-30 03:01:16,199 - INFO - allennlp.common.params - trainer.end_callbacks = None\n", "2022-11-30 03:01:16,200 - INFO - allennlp.common.params - trainer.trainer_callbacks = None\n", "2022-11-30 03:01:16,508 - INFO - allennlp.common.params - trainer.optimizer.type = adamw\n", "2022-11-30 03:01:16,518 - INFO - allennlp.common.params - trainer.optimizer.lr = 0.001\n", "2022-11-30 03:01:16,520 - INFO - allennlp.common.params - trainer.optimizer.betas = (0.9, 0.999)\n", "2022-11-30 03:01:16,521 - INFO - allennlp.common.params - trainer.optimizer.eps = 1e-08\n", "2022-11-30 03:01:16,522 - INFO - allennlp.common.params - trainer.optimizer.weight_decay = 0\n", "2022-11-30 03:01:16,523 - INFO - allennlp.common.params - trainer.optimizer.amsgrad = False\n", "2022-11-30 03:01:16,526 - INFO - allennlp.training.optimizers - Done constructing parameter groups.\n", "2022-11-30 03:01:16,527 - INFO - allennlp.training.optimizers - Group 0: ['_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.value.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.query.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.intermediate.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.query.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.key.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.pooler.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.key.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.intermediate.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.query.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.key.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.intermediate.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.value.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.key.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.intermediate.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.intermediate.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.key.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.key.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.value.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.query.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.value.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.pooler.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.value.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.value.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.query.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.key.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.key.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.query.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.key.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.key.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.key.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.intermediate.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.query.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.intermediate.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.value.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.key.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.intermediate.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.intermediate.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.key.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.query.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.query.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.key.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.query.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.value.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.query.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.value.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.key.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.intermediate.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.key.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.key.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.query.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.value.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.value.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.intermediate.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.intermediate.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.intermediate.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.query.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.query.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.intermediate.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.query.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.value.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.key.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.value.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.value.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.intermediate.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.word_embeddings.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.intermediate.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.key.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.intermediate.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.value.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.intermediate.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.value.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.query.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.value.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.position_embeddings.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.query.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.value.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.intermediate.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.key.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.query.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.key.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.value.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.token_type_embeddings.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.intermediate.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.query.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.value.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.query.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.intermediate.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.output.LayerNorm.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.intermediate.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.key.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.intermediate.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.value.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.query.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.value.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.output.LayerNorm.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.value.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.value.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.key.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.query.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.output.dense.weight', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.key.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.intermediate.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.query.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.output.dense.bias', '_embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.query.weight'], {'finetune': True, 'lr': 5e-05, 'weight_decay': 0.01}\n", "2022-11-30 03:01:16,530 - INFO - allennlp.training.optimizers - Group 1: [], {'lr': 0.01}\n", "2022-11-30 03:01:16,531 - INFO - allennlp.training.optimizers - Group 2: ['_ner._ner_scorers.None__ner_labels.0._module._linear_layers.1.weight', '_relation._relation_feedforwards.None__relation_labels._linear_layers.1.bias', '_relation._relation_scorers.None__relation_labels.bias', '_endpoint_span_extractor._span_width_embedding.weight', '_relation._relation_feedforwards.None__relation_labels._linear_layers.1.weight', '_ner._ner_scorers.None__ner_labels.0._module._linear_layers.0.weight', '_relation._relation_feedforwards.None__relation_labels._linear_layers.0.bias', '_relation._relation_feedforwards.None__relation_labels._linear_layers.0.weight', '_relation.d_embedder.embedder.weight', '_ner._ner_scorers.None__ner_labels.1._module.bias', '_ner._ner_scorers.None__ner_labels.0._module._linear_layers.0.bias', '_ner._ner_scorers.None__ner_labels.1._module.weight', '_ner._ner_scorers.None__ner_labels.0._module._linear_layers.1.bias', '_relation._relation_scorers.None__relation_labels.weight'], {}\n", "2022-11-30 03:01:16,532 - WARNING - allennlp.training.optimizers - When constructing parameter groups, scalar_parameters does not match any parameter name\n", "2022-11-30 03:01:16,534 - INFO - allennlp.training.optimizers - Number of trainable parameters: 110249737\n", "2022-11-30 03:01:16,538 - INFO - allennlp.common.util - The following parameters are Frozen (without gradient):\n", "2022-11-30 03:01:16,542 - INFO - allennlp.common.util - The following parameters are Tunable (with gradient):\n", "2022-11-30 03:01:16,544 - INFO - allennlp.common.util - _endpoint_span_extractor._span_width_embedding.weight\n", "2022-11-30 03:01:16,545 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.word_embeddings.weight\n", "2022-11-30 03:01:16,547 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.position_embeddings.weight\n", "2022-11-30 03:01:16,548 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.token_type_embeddings.weight\n", "2022-11-30 03:01:16,549 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.LayerNorm.weight\n", "2022-11-30 03:01:16,550 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.embeddings.LayerNorm.bias\n", "2022-11-30 03:01:16,552 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.query.weight\n", "2022-11-30 03:01:16,553 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.query.bias\n", "2022-11-30 03:01:16,554 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.key.weight\n", "2022-11-30 03:01:16,556 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.key.bias\n", "2022-11-30 03:01:16,557 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.value.weight\n", "2022-11-30 03:01:16,558 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.self.value.bias\n", "2022-11-30 03:01:16,559 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.output.dense.weight\n", "2022-11-30 03:01:16,561 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.output.dense.bias\n", "2022-11-30 03:01:16,562 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,563 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,564 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.intermediate.dense.weight\n", "2022-11-30 03:01:16,566 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.intermediate.dense.bias\n", "2022-11-30 03:01:16,567 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.output.dense.weight\n", "2022-11-30 03:01:16,568 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.output.dense.bias\n", "2022-11-30 03:01:16,570 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.output.LayerNorm.weight\n", "2022-11-30 03:01:16,571 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.0.output.LayerNorm.bias\n", "2022-11-30 03:01:16,572 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.query.weight\n", "2022-11-30 03:01:16,573 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.query.bias\n", "2022-11-30 03:01:16,575 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.key.weight\n", "2022-11-30 03:01:16,576 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.key.bias\n", "2022-11-30 03:01:16,577 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.value.weight\n", "2022-11-30 03:01:16,578 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.self.value.bias\n", "2022-11-30 03:01:16,580 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.output.dense.weight\n", "2022-11-30 03:01:16,581 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.output.dense.bias\n", "2022-11-30 03:01:16,582 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,583 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,585 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.intermediate.dense.weight\n", "2022-11-30 03:01:16,586 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.intermediate.dense.bias\n", "2022-11-30 03:01:16,587 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.output.dense.weight\n", "2022-11-30 03:01:16,589 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.output.dense.bias\n", "2022-11-30 03:01:16,590 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.output.LayerNorm.weight\n", "2022-11-30 03:01:16,591 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.1.output.LayerNorm.bias\n", "2022-11-30 03:01:16,592 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.query.weight\n", "2022-11-30 03:01:16,594 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.query.bias\n", "2022-11-30 03:01:16,595 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.key.weight\n", "2022-11-30 03:01:16,596 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.key.bias\n", "2022-11-30 03:01:16,598 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.value.weight\n", "2022-11-30 03:01:16,599 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.self.value.bias\n", "2022-11-30 03:01:16,600 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.output.dense.weight\n", "2022-11-30 03:01:16,602 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.output.dense.bias\n", "2022-11-30 03:01:16,603 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,604 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,605 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.intermediate.dense.weight\n", "2022-11-30 03:01:16,607 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.intermediate.dense.bias\n", "2022-11-30 03:01:16,608 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.output.dense.weight\n", "2022-11-30 03:01:16,609 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.output.dense.bias\n", "2022-11-30 03:01:16,611 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.output.LayerNorm.weight\n", "2022-11-30 03:01:16,612 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.2.output.LayerNorm.bias\n", "2022-11-30 03:01:16,613 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.query.weight\n", "2022-11-30 03:01:16,614 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.query.bias\n", "2022-11-30 03:01:16,616 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.key.weight\n", "2022-11-30 03:01:16,617 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.key.bias\n", "2022-11-30 03:01:16,618 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.value.weight\n", "2022-11-30 03:01:16,620 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.self.value.bias\n", "2022-11-30 03:01:16,621 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.output.dense.weight\n", "2022-11-30 03:01:16,622 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.output.dense.bias\n", "2022-11-30 03:01:16,623 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,625 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,626 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.intermediate.dense.weight\n", "2022-11-30 03:01:16,627 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.intermediate.dense.bias\n", "2022-11-30 03:01:16,628 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.output.dense.weight\n", "2022-11-30 03:01:16,629 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.output.dense.bias\n", "2022-11-30 03:01:16,631 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.output.LayerNorm.weight\n", "2022-11-30 03:01:16,632 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.3.output.LayerNorm.bias\n", "2022-11-30 03:01:16,633 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.query.weight\n", "2022-11-30 03:01:16,634 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.query.bias\n", "2022-11-30 03:01:16,635 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.key.weight\n", "2022-11-30 03:01:16,637 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.key.bias\n", "2022-11-30 03:01:16,638 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.value.weight\n", "2022-11-30 03:01:16,639 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.self.value.bias\n", "2022-11-30 03:01:16,640 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.output.dense.weight\n", "2022-11-30 03:01:16,641 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.output.dense.bias\n", "2022-11-30 03:01:16,642 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,643 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,644 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.intermediate.dense.weight\n", "2022-11-30 03:01:16,645 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.intermediate.dense.bias\n", "2022-11-30 03:01:16,647 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.output.dense.weight\n", "2022-11-30 03:01:16,648 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.output.dense.bias\n", "2022-11-30 03:01:16,649 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.output.LayerNorm.weight\n", "2022-11-30 03:01:16,650 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.4.output.LayerNorm.bias\n", "2022-11-30 03:01:16,651 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.query.weight\n", "2022-11-30 03:01:16,653 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.query.bias\n", "2022-11-30 03:01:16,654 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.key.weight\n", "2022-11-30 03:01:16,655 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.key.bias\n", "2022-11-30 03:01:16,656 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.value.weight\n", "2022-11-30 03:01:16,658 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.self.value.bias\n", "2022-11-30 03:01:16,659 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.output.dense.weight\n", "2022-11-30 03:01:16,660 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.output.dense.bias\n", "2022-11-30 03:01:16,661 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,661 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,663 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.intermediate.dense.weight\n", "2022-11-30 03:01:16,664 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.intermediate.dense.bias\n", "2022-11-30 03:01:16,665 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.output.dense.weight\n", "2022-11-30 03:01:16,666 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.output.dense.bias\n", "2022-11-30 03:01:16,667 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.output.LayerNorm.weight\n", "2022-11-30 03:01:16,668 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.5.output.LayerNorm.bias\n", "2022-11-30 03:01:16,669 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.query.weight\n", "2022-11-30 03:01:16,670 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.query.bias\n", "2022-11-30 03:01:16,671 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.key.weight\n", "2022-11-30 03:01:16,674 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.key.bias\n", "2022-11-30 03:01:16,675 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.value.weight\n", "2022-11-30 03:01:16,676 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.self.value.bias\n", "2022-11-30 03:01:16,677 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.output.dense.weight\n", "2022-11-30 03:01:16,679 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.output.dense.bias\n", "2022-11-30 03:01:16,680 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,681 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,682 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.intermediate.dense.weight\n", "2022-11-30 03:01:16,683 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.intermediate.dense.bias\n", "2022-11-30 03:01:16,685 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.output.dense.weight\n", "2022-11-30 03:01:16,686 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.output.dense.bias\n", "2022-11-30 03:01:16,687 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.output.LayerNorm.weight\n", "2022-11-30 03:01:16,688 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.6.output.LayerNorm.bias\n", "2022-11-30 03:01:16,689 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.query.weight\n", "2022-11-30 03:01:16,690 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.query.bias\n", "2022-11-30 03:01:16,691 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.key.weight\n", "2022-11-30 03:01:16,692 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.key.bias\n", "2022-11-30 03:01:16,694 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.value.weight\n", "2022-11-30 03:01:16,695 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.self.value.bias\n", "2022-11-30 03:01:16,696 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.output.dense.weight\n", "2022-11-30 03:01:16,697 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.output.dense.bias\n", "2022-11-30 03:01:16,698 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,700 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,701 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.intermediate.dense.weight\n", "2022-11-30 03:01:16,702 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.intermediate.dense.bias\n", "2022-11-30 03:01:16,703 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.output.dense.weight\n", "2022-11-30 03:01:16,705 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.output.dense.bias\n", "2022-11-30 03:01:16,706 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.output.LayerNorm.weight\n", "2022-11-30 03:01:16,707 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.7.output.LayerNorm.bias\n", "2022-11-30 03:01:16,708 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.query.weight\n", "2022-11-30 03:01:16,710 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.query.bias\n", "2022-11-30 03:01:16,711 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.key.weight\n", "2022-11-30 03:01:16,712 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.key.bias\n", "2022-11-30 03:01:16,713 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.value.weight\n", "2022-11-30 03:01:16,714 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.self.value.bias\n", "2022-11-30 03:01:16,716 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.output.dense.weight\n", "2022-11-30 03:01:16,717 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.output.dense.bias\n", "2022-11-30 03:01:16,718 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,720 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,721 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.intermediate.dense.weight\n", "2022-11-30 03:01:16,722 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.intermediate.dense.bias\n", "2022-11-30 03:01:16,723 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.output.dense.weight\n", "2022-11-30 03:01:16,725 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.output.dense.bias\n", "2022-11-30 03:01:16,726 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.output.LayerNorm.weight\n", "2022-11-30 03:01:16,727 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.8.output.LayerNorm.bias\n", "2022-11-30 03:01:16,728 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.query.weight\n", "2022-11-30 03:01:16,730 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.query.bias\n", "2022-11-30 03:01:16,731 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.key.weight\n", "2022-11-30 03:01:16,732 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.key.bias\n", "2022-11-30 03:01:16,733 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.value.weight\n", "2022-11-30 03:01:16,735 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.self.value.bias\n", "2022-11-30 03:01:16,736 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.output.dense.weight\n", "2022-11-30 03:01:16,737 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.output.dense.bias\n", "2022-11-30 03:01:16,738 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,740 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,741 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.intermediate.dense.weight\n", "2022-11-30 03:01:16,742 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.intermediate.dense.bias\n", "2022-11-30 03:01:16,744 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.output.dense.weight\n", "2022-11-30 03:01:16,746 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.output.dense.bias\n", "2022-11-30 03:01:16,747 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.output.LayerNorm.weight\n", "2022-11-30 03:01:16,748 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.9.output.LayerNorm.bias\n", "2022-11-30 03:01:16,749 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.query.weight\n", "2022-11-30 03:01:16,751 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.query.bias\n", "2022-11-30 03:01:16,752 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.key.weight\n", "2022-11-30 03:01:16,753 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.key.bias\n", "2022-11-30 03:01:16,754 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.value.weight\n", "2022-11-30 03:01:16,756 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.self.value.bias\n", "2022-11-30 03:01:16,757 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.output.dense.weight\n", "2022-11-30 03:01:16,758 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.output.dense.bias\n", "2022-11-30 03:01:16,760 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,761 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,762 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.intermediate.dense.weight\n", "2022-11-30 03:01:16,763 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.intermediate.dense.bias\n", "2022-11-30 03:01:16,765 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.output.dense.weight\n", "2022-11-30 03:01:16,766 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.output.dense.bias\n", "2022-11-30 03:01:16,767 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.output.LayerNorm.weight\n", "2022-11-30 03:01:16,836 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.10.output.LayerNorm.bias\n", "2022-11-30 03:01:16,837 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.query.weight\n", "2022-11-30 03:01:16,839 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.query.bias\n", "2022-11-30 03:01:16,840 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.key.weight\n", "2022-11-30 03:01:16,841 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.key.bias\n", "2022-11-30 03:01:16,842 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.value.weight\n", "2022-11-30 03:01:16,844 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.self.value.bias\n", "2022-11-30 03:01:16,845 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.output.dense.weight\n", "2022-11-30 03:01:16,846 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.output.dense.bias\n", "2022-11-30 03:01:16,848 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.output.LayerNorm.weight\n", "2022-11-30 03:01:16,849 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.attention.output.LayerNorm.bias\n", "2022-11-30 03:01:16,850 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.intermediate.dense.weight\n", "2022-11-30 03:01:16,859 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.intermediate.dense.bias\n", "2022-11-30 03:01:16,893 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.output.dense.weight\n", "2022-11-30 03:01:16,895 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.output.dense.bias\n", "2022-11-30 03:01:16,898 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.output.LayerNorm.weight\n", "2022-11-30 03:01:16,900 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.encoder.layer.11.output.LayerNorm.bias\n", "2022-11-30 03:01:16,902 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.pooler.dense.weight\n", "2022-11-30 03:01:16,904 - INFO - allennlp.common.util - _embedder.token_embedder_bert._matched_embedder.transformer_model.pooler.dense.bias\n", "2022-11-30 03:01:16,906 - INFO - allennlp.common.util - _ner._ner_scorers.None__ner_labels.0._module._linear_layers.0.weight\n", "2022-11-30 03:01:16,907 - INFO - allennlp.common.util - _ner._ner_scorers.None__ner_labels.0._module._linear_layers.0.bias\n", "2022-11-30 03:01:16,910 - INFO - allennlp.common.util - _ner._ner_scorers.None__ner_labels.0._module._linear_layers.1.weight\n", "2022-11-30 03:01:16,912 - INFO - allennlp.common.util - _ner._ner_scorers.None__ner_labels.0._module._linear_layers.1.bias\n", "2022-11-30 03:01:16,913 - INFO - allennlp.common.util - _ner._ner_scorers.None__ner_labels.1._module.weight\n", "2022-11-30 03:01:16,914 - INFO - allennlp.common.util - _ner._ner_scorers.None__ner_labels.1._module.bias\n", "2022-11-30 03:01:16,915 - INFO - allennlp.common.util - _relation.d_embedder.embedder.weight\n", "2022-11-30 03:01:16,917 - INFO - allennlp.common.util - _relation._relation_feedforwards.None__relation_labels._linear_layers.0.weight\n", "2022-11-30 03:01:16,919 - INFO - allennlp.common.util - _relation._relation_feedforwards.None__relation_labels._linear_layers.0.bias\n", "2022-11-30 03:01:16,920 - INFO - allennlp.common.util - _relation._relation_feedforwards.None__relation_labels._linear_layers.1.weight\n", "2022-11-30 03:01:16,922 - INFO - allennlp.common.util - _relation._relation_feedforwards.None__relation_labels._linear_layers.1.bias\n", "2022-11-30 03:01:16,926 - INFO - allennlp.common.util - _relation._relation_scorers.None__relation_labels.weight\n", "2022-11-30 03:01:16,928 - INFO - allennlp.common.util - _relation._relation_scorers.None__relation_labels.bias\n", "2022-11-30 03:01:16,929 - INFO - allennlp.common.params - trainer.learning_rate_scheduler.type = slanted_triangular\n", "2022-11-30 03:01:16,932 - INFO - allennlp.common.params - trainer.learning_rate_scheduler.cut_frac = 0.1\n", "2022-11-30 03:01:16,933 - INFO - allennlp.common.params - trainer.learning_rate_scheduler.ratio = 32\n", "2022-11-30 03:01:16,935 - INFO - allennlp.common.params - trainer.learning_rate_scheduler.last_epoch = -1\n", "2022-11-30 03:01:16,936 - INFO - allennlp.common.params - trainer.learning_rate_scheduler.gradual_unfreezing = False\n", "2022-11-30 03:01:16,941 - INFO - allennlp.common.params - trainer.learning_rate_scheduler.discriminative_fine_tuning = False\n", "2022-11-30 03:01:16,942 - INFO - allennlp.common.params - trainer.learning_rate_scheduler.decay_factor = 0.38\n", "2022-11-30 03:01:16,943 - INFO - allennlp.common.params - trainer.checkpointer.type = default\n", "2022-11-30 03:01:16,945 - INFO - allennlp.common.params - trainer.checkpointer.keep_serialized_model_every_num_seconds = None\n", "2022-11-30 03:01:16,946 - INFO - allennlp.common.params - trainer.checkpointer.num_serialized_models_to_keep = 1\n", "2022-11-30 03:01:16,948 - INFO - allennlp.common.params - trainer.checkpointer.model_save_interval = None\n", "2022-11-30 03:01:16,949 - INFO - allennlp.common.params - summary_interval = 100\n", "2022-11-30 03:01:16,950 - INFO - allennlp.common.params - histogram_interval = None\n", "2022-11-30 03:01:16,951 - INFO - allennlp.common.params - batch_size_interval = None\n", "2022-11-30 03:01:16,952 - INFO - allennlp.common.params - should_log_parameter_statistics = True\n", "2022-11-30 03:01:16,954 - INFO - allennlp.common.params - should_log_learning_rate = False\n", "2022-11-30 03:01:16,955 - INFO - allennlp.common.params - get_batch_num_total = None\n", "2022-11-30 03:01:16,967 - WARNING - allennlp.training.trainer - You provided a validation dataset but patience was set to None, meaning that early stopping is disabled\n", "2022-11-30 03:01:16,968 - INFO - allennlp.training.trainer - Beginning training.\n", "2022-11-30 03:01:16,969 - INFO - allennlp.training.trainer - Epoch 0/9\n", "2022-11-30 03:01:16,971 - INFO - allennlp.training.trainer - Worker 0 memory usage: 4.0G\n", "2022-11-30 03:01:16,972 - INFO - allennlp.training.trainer - GPU 0 memory usage: 844M\n", "2022-11-30 03:01:16,974 - INFO - allennlp.training.trainer - Training\n" ] }, { "output_type": "stream", "name": "stderr", "text": [ "\r 0%| | 0/906 [00:00.make_feedforward at 0x7f26de145f80>, 'span_emb_dim': 1556, 'feature_size': 20, 'spans_per_word': 0.5, 'positive_label_weight': 1.0, 'regularizer': None, 'use_distance_embeds': True, 'use_pruning': True, 'kwargs': {}, 'vocab': Vocabulary with namespaces: None__relation_labels, Size: 3 || None__ner_labels, Size: 3 || Non Padded Namespaces: {'*tags', '*labels'}, '__class__': }}\n", "{'token_emb_dim': 768, 'span_emb_dim': 1556, 'relation_scorer_dim': 3240}\n", "{'relation_loss_fn': CrossEntropyLoss()}\n" ] }, { "output_type": "stream", "name": "stderr", "text": [ "reading instances: 328it [00:00, 802.08it/s] \n" ] }, { "output_type": "stream", "name": "stdout", "text": [ "{\n", " \"path_pred\": \"pred.txt\",\n", " \"path_gold\": \"aste/data/triplet_data/14lap/test.txt\",\n", " \"precision\": 0.658695652173913,\n", " \"recall\": 0.5580110497237569,\n", " \"score\": 0.6041874376869392\n", "}\n" ] } ], "source": [ "# Evaluate SpanModel F1 Score\n", "import json\n", "\n", "path_pred = \"pred.txt\"\n", "path_test = f\"aste/data/triplet_data/{data_name}/test.txt\"\n", "model.predict(path_in=path_test, path_out=path_pred)\n", "results = model.score(path_pred, path_test)\n", "print(json.dumps(results, indent=2))" ] } ], "metadata": { "accelerator": "GPU", "colab": { "provenance": [] }, "kernelspec": { "display_name": "Python 3", "name": "python3" }, "language_info": { "name": "python" }, "widgets": { "application/vnd.jupyter.widget-state+json": { "f61ea767ae064779b77f7d206a90b765": { "model_module": "@jupyter-widgets/controls", "model_name": "HBoxModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HBoxModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HBoxView", "box_style": "", "children": [ "IPY_MODEL_382e7815e6314a798943a7f71eab1dbd", "IPY_MODEL_b3f970d5f20748d091d13d1d37e712e4", "IPY_MODEL_3c925c25029e4e5a9515b525a819cb31" ], "layout": "IPY_MODEL_17148c3a40ae4572923f16f249179b9b" } }, "382e7815e6314a798943a7f71eab1dbd": { "model_module": "@jupyter-widgets/controls", "model_name": "HTMLModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HTMLModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HTMLView", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_9cc1d9231ee34d33b65a88c4de3b213f", "placeholder": "", "style": "IPY_MODEL_9afa9b48d00748739422b2e32763e57d", "value": "Downloading: 100%" } }, "b3f970d5f20748d091d13d1d37e712e4": { "model_module": "@jupyter-widgets/controls", "model_name": "FloatProgressModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "FloatProgressModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "ProgressView", "bar_style": "success", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_f6d16c6d56974ec88f55333b65e0f16a", "max": 433, "min": 0, "orientation": "horizontal", "style": "IPY_MODEL_e776ac7bd605497395d6cf45648c46e0", "value": 433 } }, "3c925c25029e4e5a9515b525a819cb31": { "model_module": "@jupyter-widgets/controls", "model_name": "HTMLModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HTMLModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HTMLView", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_87d171d5ff4d48bea3781c4185c53cd3", "placeholder": "", "style": "IPY_MODEL_ac44150d1166470f944a1d0effeae80b", "value": " 433/433 [00:00<00:00, 13.3kB/s]" } }, "17148c3a40ae4572923f16f249179b9b": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "9cc1d9231ee34d33b65a88c4de3b213f": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "9afa9b48d00748739422b2e32763e57d": { "model_module": "@jupyter-widgets/controls", "model_name": "DescriptionStyleModel", "model_module_version": "1.5.0", "state": { "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "DescriptionStyleModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "StyleView", "description_width": "" } }, "f6d16c6d56974ec88f55333b65e0f16a": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "e776ac7bd605497395d6cf45648c46e0": { "model_module": "@jupyter-widgets/controls", "model_name": "ProgressStyleModel", "model_module_version": "1.5.0", "state": { "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "ProgressStyleModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "StyleView", "bar_color": null, "description_width": "" } }, "87d171d5ff4d48bea3781c4185c53cd3": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "ac44150d1166470f944a1d0effeae80b": { "model_module": "@jupyter-widgets/controls", "model_name": "DescriptionStyleModel", "model_module_version": "1.5.0", "state": { "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "DescriptionStyleModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "StyleView", "description_width": "" } }, "916c3c664f2348b5b608c368090945ac": { "model_module": "@jupyter-widgets/controls", "model_name": "HBoxModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HBoxModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HBoxView", "box_style": "", "children": [ "IPY_MODEL_f00d08843e1a4e9e911a8d9fd11f04d1", "IPY_MODEL_de26b5b4f1be42cba2951f528f7715ba", "IPY_MODEL_d5d290cde75d463ba7b9b220eed79ca7" ], "layout": "IPY_MODEL_e30953017bae40849979501dbb4647bc" } }, "f00d08843e1a4e9e911a8d9fd11f04d1": { "model_module": "@jupyter-widgets/controls", "model_name": "HTMLModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HTMLModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HTMLView", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_08b2e55d6325474da282c48e0f959a56", "placeholder": "", "style": "IPY_MODEL_542e865145b547ffbe61dec7fb94bab7", "value": "Downloading: 100%" } }, "de26b5b4f1be42cba2951f528f7715ba": { "model_module": "@jupyter-widgets/controls", "model_name": "FloatProgressModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "FloatProgressModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "ProgressView", "bar_style": "success", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_1ac6bf7c4d7d4fbd8d1c85ec426854db", "max": 231508, "min": 0, "orientation": "horizontal", "style": "IPY_MODEL_808d2ba240c241e9a6989a03c4134a33", "value": 231508 } }, "d5d290cde75d463ba7b9b220eed79ca7": { "model_module": "@jupyter-widgets/controls", "model_name": "HTMLModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HTMLModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HTMLView", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_886551311e7d4ee9823ecd34dfc82811", "placeholder": "", "style": "IPY_MODEL_988ec5ae620d4d67b6749ee92a2cb560", "value": " 232k/232k [00:00<00:00, 209kB/s]" } }, "e30953017bae40849979501dbb4647bc": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "08b2e55d6325474da282c48e0f959a56": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "542e865145b547ffbe61dec7fb94bab7": { "model_module": "@jupyter-widgets/controls", "model_name": "DescriptionStyleModel", "model_module_version": "1.5.0", "state": { "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "DescriptionStyleModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "StyleView", "description_width": "" } }, "1ac6bf7c4d7d4fbd8d1c85ec426854db": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "808d2ba240c241e9a6989a03c4134a33": { "model_module": "@jupyter-widgets/controls", "model_name": "ProgressStyleModel", "model_module_version": "1.5.0", "state": { "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "ProgressStyleModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "StyleView", "bar_color": null, "description_width": "" } }, "886551311e7d4ee9823ecd34dfc82811": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "988ec5ae620d4d67b6749ee92a2cb560": { "model_module": "@jupyter-widgets/controls", "model_name": "DescriptionStyleModel", "model_module_version": "1.5.0", "state": { "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "DescriptionStyleModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "StyleView", "description_width": "" } }, "9463e5ed29e74f05869715f4669d1fa5": { "model_module": "@jupyter-widgets/controls", "model_name": "HBoxModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HBoxModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HBoxView", "box_style": "", "children": [ "IPY_MODEL_5e57195d10d7414c9f418af4e7eca84a", "IPY_MODEL_e4bb3941e21d45f2b2327690b4d589bf", "IPY_MODEL_321f61ce086b4ace9260a2d55afbdefa" ], "layout": "IPY_MODEL_94f8b1fb0c764cfa9af078bd238623d4" } }, "5e57195d10d7414c9f418af4e7eca84a": { "model_module": "@jupyter-widgets/controls", "model_name": "HTMLModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HTMLModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HTMLView", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_621130d9d8cf468abe5709a85f07d106", "placeholder": "", "style": "IPY_MODEL_1453b743641b45758303e91bfedafe03", "value": "Downloading: 100%" } }, "e4bb3941e21d45f2b2327690b4d589bf": { "model_module": "@jupyter-widgets/controls", "model_name": "FloatProgressModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "FloatProgressModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "ProgressView", "bar_style": "success", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_a7aeaf582d15403dbe447d57789b691f", "max": 466062, "min": 0, "orientation": "horizontal", "style": "IPY_MODEL_d1d0b028b6c04d59ada3bdfb7efde504", "value": 466062 } }, "321f61ce086b4ace9260a2d55afbdefa": { "model_module": "@jupyter-widgets/controls", "model_name": "HTMLModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HTMLModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HTMLView", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_0a203635e4a54efd96b85633164a067d", "placeholder": "", "style": "IPY_MODEL_c55350fd925a454eae62f9da4ed21962", "value": " 466k/466k [00:01<00:00, 503kB/s]" } }, "94f8b1fb0c764cfa9af078bd238623d4": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "621130d9d8cf468abe5709a85f07d106": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "1453b743641b45758303e91bfedafe03": { "model_module": "@jupyter-widgets/controls", "model_name": "DescriptionStyleModel", "model_module_version": "1.5.0", "state": { "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "DescriptionStyleModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "StyleView", "description_width": "" } }, "a7aeaf582d15403dbe447d57789b691f": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "d1d0b028b6c04d59ada3bdfb7efde504": { "model_module": "@jupyter-widgets/controls", "model_name": "ProgressStyleModel", "model_module_version": "1.5.0", "state": { "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "ProgressStyleModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "StyleView", "bar_color": null, "description_width": "" } }, "0a203635e4a54efd96b85633164a067d": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "c55350fd925a454eae62f9da4ed21962": { "model_module": "@jupyter-widgets/controls", "model_name": "DescriptionStyleModel", "model_module_version": "1.5.0", "state": { "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "DescriptionStyleModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "StyleView", "description_width": "" } }, "21dd3d5e1468453ab2f81d5e184a990e": { "model_module": "@jupyter-widgets/controls", "model_name": "HBoxModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HBoxModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HBoxView", "box_style": "", "children": [ "IPY_MODEL_a18149514fe94397abd4bcafd4df0807", "IPY_MODEL_c73b50f20f5f4b6c8ccca8e1ec61e738", "IPY_MODEL_fb17189f06074ca39d8251ea2ece15f3" ], "layout": "IPY_MODEL_b379be7248c84e88b3a5bc8362e56e2f" } }, "a18149514fe94397abd4bcafd4df0807": { "model_module": "@jupyter-widgets/controls", "model_name": "HTMLModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HTMLModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HTMLView", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_7e85b97fbf8642ecb7613a8b3646b6dc", "placeholder": "", "style": "IPY_MODEL_f13fd92805504c0dae5b22e404c256fa", "value": "Downloading: 100%" } }, "c73b50f20f5f4b6c8ccca8e1ec61e738": { "model_module": "@jupyter-widgets/controls", "model_name": "FloatProgressModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "FloatProgressModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "ProgressView", "bar_style": "success", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_86c67fc1ac0d47bbace0fe3b6f24c7ce", "max": 440473133, "min": 0, "orientation": "horizontal", "style": "IPY_MODEL_46568a6cac834c86854b6e41c7e7219a", "value": 440473133 } }, "fb17189f06074ca39d8251ea2ece15f3": { "model_module": "@jupyter-widgets/controls", "model_name": "HTMLModel", "model_module_version": "1.5.0", "state": { "_dom_classes": [], "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "HTMLModel", "_view_count": null, "_view_module": "@jupyter-widgets/controls", "_view_module_version": "1.5.0", "_view_name": "HTMLView", "description": "", "description_tooltip": null, "layout": "IPY_MODEL_fd38ef9382a6488a8be23d5bdb1fb533", "placeholder": "", "style": "IPY_MODEL_e01ecdf66c3143809825cbbad4aaeebb", "value": " 440M/440M [00:07<00:00, 52.8MB/s]" } }, "b379be7248c84e88b3a5bc8362e56e2f": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "7e85b97fbf8642ecb7613a8b3646b6dc": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "f13fd92805504c0dae5b22e404c256fa": { "model_module": "@jupyter-widgets/controls", "model_name": "DescriptionStyleModel", "model_module_version": "1.5.0", "state": { "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "DescriptionStyleModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "StyleView", "description_width": "" } }, "86c67fc1ac0d47bbace0fe3b6f24c7ce": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "46568a6cac834c86854b6e41c7e7219a": { "model_module": "@jupyter-widgets/controls", "model_name": "ProgressStyleModel", "model_module_version": "1.5.0", "state": { "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "ProgressStyleModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "StyleView", "bar_color": null, "description_width": "" } }, "fd38ef9382a6488a8be23d5bdb1fb533": { "model_module": "@jupyter-widgets/base", "model_name": "LayoutModel", "model_module_version": "1.2.0", "state": { "_model_module": "@jupyter-widgets/base", "_model_module_version": "1.2.0", "_model_name": "LayoutModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "LayoutView", "align_content": null, "align_items": null, "align_self": null, "border": null, "bottom": null, "display": null, "flex": null, "flex_flow": null, "grid_area": null, "grid_auto_columns": null, "grid_auto_flow": null, "grid_auto_rows": null, "grid_column": null, "grid_gap": null, "grid_row": null, "grid_template_areas": null, "grid_template_columns": null, "grid_template_rows": null, "height": null, "justify_content": null, "justify_items": null, "left": null, "margin": null, "max_height": null, "max_width": null, "min_height": null, "min_width": null, "object_fit": null, "object_position": null, "order": null, "overflow": null, "overflow_x": null, "overflow_y": null, "padding": null, "right": null, "top": null, "visibility": null, "width": null } }, "e01ecdf66c3143809825cbbad4aaeebb": { "model_module": "@jupyter-widgets/controls", "model_name": "DescriptionStyleModel", "model_module_version": "1.5.0", "state": { "_model_module": "@jupyter-widgets/controls", "_model_module_version": "1.5.0", "_model_name": "DescriptionStyleModel", "_view_count": null, "_view_module": "@jupyter-widgets/base", "_view_module_version": "1.2.0", "_view_name": "StyleView", "description_width": "" } } } } }, "nbformat": 4, "nbformat_minor": 0 } ================================================ FILE: requirements.txt ================================================ Cython==0.29.21 PYEVALB==0.1.3 allennlp-models==1.2.2 allennlp==1.2.2 botocore==1.19.46 fire==0.3.1 nltk==3.6.6 numpy==1.21.5 pandas==1.1.5 pydantic==1.6.2 scikit-learn==0.22.2.post1 torch==1.7.0 torchvision==0.8.1 transformers==3.4.0 ================================================ FILE: sample_data.txt ================================================ I charge it at night and skip taking the cord with me because of the good battery life .#### #### ####[([16, 17], [15], 'POS')] it is of high quality , has a killer GUI , is extremely stable , is highly expandable , is bundled with lots of very good applications , is easy to use , and is absolutely gorgeous .#### #### ####[([4], [3], 'POS'), ([9], [8], 'POS'), ([26], [25], 'POS'), ([31], [29], 'POS')] Easy to start up and does not overheat as much as other laptops .#### #### ####[([2, 3], [0], 'POS')] Great laptop that offers many great features !#### #### ####[([6], [5], 'POS')] One night I turned the freaking thing off after using it , the next day I turn it on , no GUI , screen all dark , power light steady , hard drive light steady and not flashing as it usually does .#### #### ####[([21], [20], 'NEG'), ([23], [25], 'NEG'), ([27, 28], [29], 'NEU'), ([31, 32, 33], [34], 'NEG')] However , the multi-touch gestures and large tracking area make having an external mouse unnecessary ( unless you 're gaming ) .#### #### ####[([12, 13], [14], 'NEU')] I love the way the entire suite of software works together .#### #### ####[([6, 7, 8], [1], 'POS')] The speed is incredible and I am more than satisfied .#### #### ####[([1], [3], 'POS'), ([1], [9], 'POS')] I can barely use any usb devices because they will not stay connected properly .#### #### ####[([5, 6], [10, 11, 12, 13], 'NEG')] When I finally had everything running with all my software installed I plugged in my droid to recharge and the system crashed .#### #### ####[([20], [21], 'NEG')] Pairing it with an iPhone is a pure pleasure - talk about painless syncing - used to take me forever - now it 's a snap .#### #### ####[([13], [12], 'POS')] I also got the added bonus of a 30 '' HD Monitor , which really helps to extend my screen and keep my eyes fresh !#### #### ####[([19], [17], 'NEU')] The machine is slow to boot up and occasionally crashes completely .#### #### ####[([5, 6], [3], 'NEG')] After paying several hundred dollars for this service , it is frustrating that you can not get help after hours .#### #### ####[([7], [11], 'NEG')] I love the operating system and the preloaded software .#### #### ####[([3, 4], [1], 'POS'), ([7, 8], [1], 'POS')] The best thing about this laptop is the price along with some of the newer features .#### #### ####[([8], [1], 'POS'), ([15], [1], 'POS'), ([15], [14], 'POS')] YOU WILL NOT BE ABLE TO TALK TO AN AMERICAN WARRANTY SERVICE IS OUT OF COUNTRY .#### #### ####[([10, 11], [2, 3, 4], 'NEG')] but now i have realized its a problem with this brand .#### #### ####[([10], [7], 'NEG')] Also kinda loud when the fan was running .#### #### ####[([5], [2], 'NEG')] There also seemed to be a problem with the hard disc as certain times windows loads but claims to not be able to find any drivers or files .#### #### ####[([9, 10], [6], 'NEG')] Speaking of the browser , it too has problems .#### #### ####[([3], [8], 'NEG')] The keyboard is too slick .#### #### ####[([1], [4], 'NEG')] It 's like 9 punds , but if you can look past it , it 's GREAT !#### #### ####[([3, 4], [16], 'NEG')] It 's just as fast with one program open as it is with sixteen open .#### #### ####[([7], [4], 'NEU')] Still under warrenty so called Toshiba , no help at all .#### #### ####[([2], [7, 8], 'NEG')] Amazing Quality !#### #### ####[([1], [0], 'POS')] A month or so ago , the freaking motherboard just died .#### #### ####[([8], [7], 'NEG'), ([8], [10], 'NEG')] The system it comes with does not work properly , so when trying to fix the problems with it it started not working at all .#### #### ####[([1], [6, 7, 8], 'NEG')] Then after 4 or so months the charger stopped working so I was forced to go out and buy new hardware just to keep this computer running .#### #### ####[([7], [8, 9], 'NEG')] If a website ever freezes ( which is rare ) , its really easy to force quit .#### #### ####[([15, 16], [13], 'POS')] I also enjoy the fact that my MacBook Pro laptop allows me to run Windows 7 on it by using the VMWare program .#### #### ####[([14, 15], [2], 'POS'), ([21, 22], [2], 'NEU')] I wanted to purchase the extended warranty and they refused , because they knew it was trouble .#### #### ####[([5, 6], [9], 'NEU')] We upgraded the memory to four gigabytes in order to take advantage of the performace increase in speed .#### #### ####[([17], [15], 'POS'), ([14], [15], 'POS')] The reality was , it heated up very quickly , and took way too long to do simple things , like opening my Documents folder .#### #### ####[([21, 22, 23, 24], [14], 'NEG')] I had always used PCs and been constantly frustrated by the crashing and the poorly designed operating systems that were never very intuitive .#### #### ####[([16, 17], [14, 15], 'NEG'), ([16, 17], [22], 'NEG')] Then , within 5 months , the charger crapped out on me .#### #### ####[([7], [8], 'NEG')] And if you have a iphone or ipod touch you can connect and download songs to it at high speed .#### #### ####[([19], [18], 'POS')] I love the glass touchpad .#### #### ####[([3, 4], [1], 'POS')] I continued to take the computer in AGAIN and they replaced the hard drive and mother board yet again .#### #### ####[([12, 13], [10], 'NEG'), ([15, 16], [10], 'NEG')] Then HP sends it back to me with the hardware screwed up , not able to connect .#### #### ####[([9], [10, 11], 'NEG')] Oh yeah , do n't forget the expensive shipping to and from HP .#### #### ####[([8], [7], 'NEG')] Everything is so easy to use , Mac software is just so much simpler than Microsoft software .#### #### ####[([7, 8], [3], 'POS'), ([15, 16], [13, 14], 'NEG'), ([5], [3], 'POS')] And if you do a lot of writing , editing is a problem since there is no forward delete key .#### #### ####[([9], [12], 'NEG')] Its ease of use and the top service from Apple- be it their phone assistance or bellying up to the genius bar -- can not be beat .#### #### ####[([3], [1], 'POS'), ([7], [6], 'POS'), ([13, 14], [23, 24, 25, 26], 'POS'), ([20, 21], [23, 24, 25, 26], 'POS')] It has a 10 hour battery life when you 're doing web browsing and word editing , making it perfect for the classroom or office , and in terms of gaming and movie playing it 'll have a battery life of just over 5 hours .#### #### ####[([5, 6], [19], 'POS'), ([11, 12], [19], 'NEU'), ([14, 15], [19], 'NEU')] Acer has set me up with FREE recovery discs , when they are available since I asked .#### #### ####[([7, 8], [6], 'POS')] Enabling the battery timer is useless .#### #### ####[([2, 3], [5], 'NEG')] There is no need to purchase virus protection for Mac , which saves me a lot of time and money .#### #### ####[([6, 7, 8, 9], [12], 'POS')] But we had paid for bluetooth , and there was none .#### #### ####[([5], [10], 'NEG')] It is always reliable , never bugged and responds well .#### #### ####[([8], [9], 'POS')] they had to replace the motherboard in April#### #### ####[([5], [3], 'NEG')] Also , if you need to talk to a representive at Microsoft , there is a charge , which I believe is robbery , since you are charged enormous amounts for a very badly designed system , which most people would have went with XP if they could .#### #### ####[([35], [33, 34], 'NEG')] I love WIndows 7 which is a vast improvment over Vista .#### #### ####[([2, 3], [1], 'POS')] Dell 's customer disservice is an insult to it 's customers who pay good money for shoddy products .#### #### ####[([0, 1, 2, 3], [6], 'NEG')] After talking it over with the very knowledgeable sales associate , I chose the MacBook Pro over the white MacBook .#### #### ####[([8, 9], [7], 'POS')] If you really want a bang-up system and do n't need to run Windows applications , go with an Apple ;#### #### ####[([6], [5], 'POS')] You wo n't have to spend gobs of money on some inefficient virus program that needs to be updated every month and that constantly drains your wallet .#### #### ####[([12, 13], [11], 'NEG')] It 's color is even cool .#### #### ####[([2], [5], 'POS')] keys are all in weird places and is way too large for the way it is designed .#### #### ####[([0], [4], 'NEG'), ([0], [10], 'NEG')] Yes , a Mac is much more money than the average laptop out there , but there is no comparison in style , speed and just cool factor .#### #### ####[([21], [18, 19], 'POS'), ([23], [18, 19], 'POS')] And not to mention after using it for a few months or so , the battery will slowly less and less hold a charge until you ca n't leave it unplugged for more than 5 minutes without the thing dying .#### #### ####[([15], [18], 'NEG')] BEST BUY - 5 STARS + + + ( sales , service , respect for old men who are n't familiar with the technology ) DELL COMPUTERS - 3 stars DELL SUPPORT - owes a me a couple#### #### ####[([9], [0], 'POS'), ([11], [0], 'POS')] no complaints with their desktop , and maybe because it just sits on your desktop , and you do n't carry it around , which could jar the hard drive , or the motherboard .#### #### ####[([28, 29], [26], 'NEU'), ([33], [26], 'NEU')] Yes , they cost more , but they more than make up for it in speed , construction quality , and longevity .#### #### ####[([15], [10, 11], 'POS'), ([17, 18], [10, 11], 'POS'), ([21], [10, 11], 'POS')] It absolutely is more expensive than most PC laptops , but the ease of use , security , and minimal problems that have arisen make it well worth the pricetag .#### #### ####[([14], [12], 'POS')] It gets stuck all of the time you use it , and you have to keep tapping on it to get it to work .#### #### ####[([8], [2], 'NEG')] lots of preloaded software .#### #### ####[([2, 3], [0], 'POS')] I wish it had a webcam though , then it would be perfect !#### #### ####[([5], [1], 'NEG')] Another thing I might add is the battery life is excellent .#### #### ####[([7, 8], [10], 'POS')] One drawback , I wish the keys were backlit .#### #### ####[([6], [1], 'NEG')] I wish the volume could be louder and the mouse didnt break after only a month .#### #### ####[([3], [6], 'NEG'), ([9], [10, 11], 'NEG')] I play a lot of casual games online , and the touchpad is very responsive .#### #### ####[([11], [14], 'POS')] It is everything I 'd hoped it would be from a look and feel standpoint , but somehow a bit more sturdy .#### #### ####[([11, 12, 13, 14], [21], 'POS')] the only fact i dont like about apples is they generally use safari and i dont use safari but after i install Mozzilla firfox i love every single bit about it .#### #### ####[([17], [15, 16], 'NEG'), ([22, 23], [25], 'POS')] Great battery , speed , display .#### #### ####[([1], [0], 'POS'), ([3], [0], 'POS'), ([5], [0], 'POS')] The delivery was fast , and I would not hesitate to purchase this laptop again .#### #### ####[([1], [3], 'POS')] I 've been impressed with the battery life and the performance for such a small amount of memory .#### #### ####[([6, 7], [3], 'POS'), ([10], [14], 'POS'), ([17], [14], 'NEG')] It 's applications are terrific , including the replacements for Microsoft office .#### #### ####[([2], [4], 'POS')] I got it back and my built-in webcam and built-in mic were shorting out anytime I touched the lid , ( mind you this was my means of communication with my fiance who was deployed ) but I suffered thru it and would constandly have to reset the computer to be able to use my cam and mic anytime they went out .#### #### ####[([6, 7], [12, 13], 'NEG'), ([9, 10], [12, 13], 'NEG'), ([55], [38], 'NEG'), ([10], [38], 'NEG')] The board has a bad connector with the power supply and shortly after warrenty expires the power supply will start having issues .#### #### ####[([1], [4], 'NEG'), ([5], [4], 'NEG'), ([16, 17], [21], 'NEG')] My dad has one of the very first Toshibas ever made , yes its abit slow now but still works well and i hooked to my ethernet !#### #### ####[([19], [20], 'POS')] Mostly I love the drag and drop feature .#### #### ####[([4, 5, 6, 7], [2], 'POS')] oh yeah , and if the fancy webcam breaks guess who you have to send it to to get it fixed ?#### #### ####[([7], [6], 'NEG')] I ordered through MacMall , which saved me the sales tax I would have incurred buying locally .#### #### ####[([9, 10], [6], 'POS')] Of course , I also have several great software packages that came for free including iWork , GarageBand , and iMovie .#### #### ####[([8, 9], [7], 'POS'), ([15], [13], 'POS'), ([17], [13], 'POS'), ([20], [13], 'POS')] The screen is very large and crystal clear with amazing colors and resolution .#### #### ####[([1], [4], 'POS'), ([1], [7], 'POS'), ([10], [9], 'POS'), ([12], [9], 'POS')] After a little more than a year of owning my MacBook Pro , the monitor has completely died .#### #### ####[([14], [17], 'NEG')] The brand of iTunes has just become ingrained in our lexicon now , but keep in mind that Apple started it all .#### #### ####[([3], [7], 'POS')] Size : I know 13 is small ( especially for a desktop replacement ) but with an external monitor , who cares .#### #### ####[([0], [6], 'NEG'), ([17, 18], [6], 'NEU')] The display is incredibly bright , much brighter than my PowerBook and very crisp .#### #### ####[([1], [4], 'POS'), ([1], [13], 'POS')] The start menu is not the easiest thing to navigate due to the stacking .#### #### ####[([1, 2], [4, 5, 6], 'NEG')] Really like the textured surface which shows no fingerprints .#### #### ####[([4], [1], 'POS')] The screen is bright and the keyboard is nice ;#### #### ####[([1], [3], 'POS'), ([6], [8], 'POS')] But the machine is awesome and iLife is great and I love Snow Leopard X .#### #### ####[([6], [8], 'POS'), ([12, 13, 14], [11], 'POS')] I thought learning the Mac OS would be hard , but it is easily picked up if you are familiar with a PC .#### #### ####[([4, 5], [13], 'POS')] It is easy to use and lightweight .#### #### ####[([4], [2], 'POS')] They also have a longer service life than other computers ( I have several friends who still use the older Apple PowerBooks ) .#### #### ####[([5, 6], [4], 'POS')] If you check you will find the same notebook with the above missing ports and a dual core AMD or Intel processor .#### #### ####[([13], [12], 'NEU')] This laptop is a great price and has a sleek look .#### #### ####[([5], [4], 'POS'), ([10], [9], 'POS')] I especially like the keyboard which has chiclet type keys .#### #### ####[([4], [2], 'POS'), ([9], [7, 8], 'POS')] ================================================ FILE: setup.sh ================================================ #!/usr/bin/env bash set -e # Main Requirements pip install -r requirements.txt pip uninstall dataclasses -y # Compatibility issue with Python > 3.6 # Optional: Set up NLTK packages if [[ -f punkt.zip ]]; then mkdir -p /home/admin/nltk_data/tokenizers cp punkt.zip /home/admin/nltk_data/tokenizers fi if [[ -f wordnet.zip ]]; then mkdir -p /home/admin/nltk_data/corpora cp wordnet.zip /home/admin/nltk_data/corpora fi # Make sample data for quick debugging unzip -n data.zip -d aste/ cd aste/data/triplet_data mkdir -p sample head -n 32 14lap/train.txt >sample/train.txt head -n 32 14lap/dev.txt >sample/dev.txt head -n 32 14lap/test.txt >sample/test.txt cd ../../.. ================================================ FILE: span_model/__init__.py ================================================ ================================================ FILE: span_model/data/__init__.py ================================================ from span_model.data.dataset_readers.span_model import SpanModelReader from span_model.data.dataset_readers.document import Document ================================================ FILE: span_model/data/dataset_readers/document.py ================================================ from span_model.models.shared import fields_to_batches, batches_to_fields import copy import numpy as np import re import json def format_float(x): return round(x, 4) class SpanCrossesSentencesError(ValueError): pass def get_sentence_of_span(span, sentence_starts, doc_tokens): """ Return the index of the sentence that the span is part of. """ # Inclusive sentence ends sentence_ends = [x - 1 for x in sentence_starts[1:]] + [doc_tokens - 1] in_between = [ span[0] >= start and span[1] <= end for start, end in zip(sentence_starts, sentence_ends) ] if sum(in_between) != 1: raise SpanCrossesSentencesError the_sentence = in_between.index(True) return the_sentence class Dataset: def __init__(self, documents): self.documents = documents def __getitem__(self, i): return self.documents[i] def __len__(self): return len(self.documents) def __repr__(self): return f"Dataset with {self.__len__()} documents." @classmethod def from_jsonl(cls, fname): documents = [] with open(fname, "r") as f: for line in f: doc = Document.from_json(json.loads(line)) documents.append(doc) return cls(documents) def to_jsonl(self, fname): to_write = [doc.to_json() for doc in self] with open(fname, "w") as f: for entry in to_write: print(json.dumps(entry), file=f) class Document: def __init__( self, doc_key, dataset, sentences, weight=None, ): self.doc_key = doc_key self.dataset = dataset self.sentences = sentences self.weight = weight @classmethod def from_json(cls, js): "Read in from json-loaded dict." cls._check_fields(js) doc_key = js["doc_key"] dataset = js.get("dataset") entries = fields_to_batches( js, [ "doc_key", "dataset", "weight", ], ) sentence_lengths = [len(entry["sentences"]) for entry in entries] sentence_starts = np.cumsum(sentence_lengths) sentence_starts = np.roll(sentence_starts, 1) sentence_starts[0] = 0 sentence_starts = sentence_starts.tolist() sentences = [ Sentence(entry, sentence_start, sentence_ix) for sentence_ix, (entry, sentence_start) in enumerate( zip(entries, sentence_starts) ) ] # Get the loss weight for this document. weight = js.get("weight", None) return cls( doc_key, dataset, sentences, weight, ) @staticmethod def _check_fields(js): "Make sure we only have allowed fields." allowed_field_regex = ( "doc_key|dataset|sentences|weight|.*ner$|" ".*relations$|.*clusters$|.*events$|^_.*" ) allowed_field_regex = re.compile(allowed_field_regex) unexpected = [] for field in js.keys(): if not allowed_field_regex.match(field): unexpected.append(field) if unexpected: msg = f"The following unexpected fields should be prefixed with an underscore: {', '.join(unexpected)}." raise ValueError(msg) def to_json(self): "Write to json dict." res = {"doc_key": self.doc_key, "dataset": self.dataset} sents_json = [sent.to_json() for sent in self] fields_json = batches_to_fields(sents_json) res.update(fields_json) if self.weight is not None: res["weight"] = self.weight return res # TODO: Write a unit test to make sure this does the correct thing. def split(self, max_tokens_per_doc): """ Greedily split a long document into smaller documents, each shorter than `max_tokens_per_doc`. Each split document will get the same weight as its parent. """ # If the document is already short enough, return it as a list with a single item. if self.n_tokens <= max_tokens_per_doc: return [self] sentences = copy.deepcopy(self.sentences) sentence_groups = [] current_group = [] group_length = 0 sentence_tok_offset = 0 sentence_ix_offset = 0 for sentence in sentences: # Can't deal with single sentences longer than the limit. if len(sentence) > max_tokens_per_doc: msg = f"Sentence \"{''.join(sentence.text)}\" has more than {max_tokens_per_doc} tokens. Please split this sentence." raise ValueError(msg) if group_length + len(sentence) <= max_tokens_per_doc: # If we're not at the limit, add it to the current sentence group. sentence.sentence_start -= sentence_tok_offset sentence.sentence_ix -= sentence_ix_offset current_group.append(sentence) group_length += len(sentence) else: # Otherwise, start a new sentence group and adjust sentence offsets. sentence_groups.append(current_group) sentence_tok_offset = sentence.sentence_start sentence_ix_offset = sentence.sentence_ix sentence.sentence_start -= sentence_tok_offset sentence.sentence_ix -= sentence_ix_offset current_group = [sentence] group_length = len(sentence) # Add the final sentence group. sentence_groups.append(current_group) # Create a separate document for each sentence group. doc_keys = [f"{self.doc_key}_SPLIT_{i}" for i in range(len(sentence_groups))] res = [ self.__class__( doc_key, self.dataset, sentence_group, self.weight, ) for doc_key, sentence_group in zip(doc_keys, sentence_groups) ] return res def __repr__(self): return "\n".join( [ str(i) + ": " + " ".join(sent.text) for i, sent in enumerate(self.sentences) ] ) def __getitem__(self, ix): return self.sentences[ix] def __len__(self): return len(self.sentences) def print_plaintext(self): for sent in self: print(" ".join(sent.text)) @property def n_tokens(self): return sum([len(sent) for sent in self.sentences]) class Sentence: def __init__(self, entry, sentence_start, sentence_ix): self.sentence_start = sentence_start self.sentence_ix = sentence_ix self.text = entry["sentences"] # Metadata fields are prefixed with a `_`. self.metadata = {k: v for k, v in entry.items() if re.match("^_", k)} if "ner" in entry: self.ner = [NER(this_ner, self) for this_ner in entry["ner"]] self.ner_dict = {entry.span.span_sent: entry.label for entry in self.ner} else: self.ner = None self.ner_dict = None # Predicted ner. if "predicted_ner" in entry: self.predicted_ner = [ PredictedNER(this_ner, self) for this_ner in entry["predicted_ner"] ] else: self.predicted_ner = None # Store relations. if "relations" in entry: self.relations = [ Relation(this_relation, self) for this_relation in entry["relations"] ] relation_dict = {} for rel in self.relations: key = (rel.pair[0].span_sent, rel.pair[1].span_sent) relation_dict[key] = rel.label self.relation_dict = relation_dict else: self.relations = None self.relation_dict = None # Predicted relations. if "predicted_relations" in entry: self.predicted_relations = [ PredictedRelation(this_relation, self) for this_relation in entry["predicted_relations"] ] else: self.predicted_relations = None def to_json(self): res = {"sentences": self.text} if self.ner is not None: res["ner"] = [entry.to_json() for entry in self.ner] if self.predicted_ner is not None: res["predicted_ner"] = [entry.to_json() for entry in self.predicted_ner] if self.relations is not None: res["relations"] = [entry.to_json() for entry in self.relations] if self.predicted_relations is not None: res["predicted_relations"] = [ entry.to_json() for entry in self.predicted_relations ] for k, v in self.metadata.items(): res[k] = v return res def __repr__(self): the_text = " ".join(self.text) the_lengths = [len(x) for x in self.text] tok_ixs = "" for i, offset in enumerate(the_lengths): true_offset = offset if i < 10 else offset - 1 tok_ixs += str(i) tok_ixs += " " * true_offset return the_text + "\n" + tok_ixs def __len__(self): return len(self.text) class Span: def __init__(self, start, end, sentence, sentence_offsets=False): # The `start` and `end` are relative to the document. We convert them to be relative to the # sentence. self.sentence = sentence # Need to store the sentence text to make span objects hashable. self.sentence_text = " ".join(sentence.text) self.start_sent = start if sentence_offsets else start - sentence.sentence_start self.end_sent = end if sentence_offsets else end - sentence.sentence_start @property def start_doc(self): return self.start_sent + self.sentence.sentence_start @property def end_doc(self): return self.end_sent + self.sentence.sentence_start @property def span_doc(self): return (self.start_doc, self.end_doc) @property def span_sent(self): return (self.start_sent, self.end_sent) @property def text(self): return self.sentence.text[self.start_sent : self.end_sent + 1] def __repr__(self): return str((self.start_sent, self.end_sent, self.text)) def __eq__(self, other): return ( self.span_doc == other.span_doc and self.span_sent == other.span_sent and self.sentence == other.sentence ) def __hash__(self): tup = self.span_sent + (self.sentence_text,) return hash(tup) class Token: def __init__(self, ix, sentence, sentence_offsets=False): self.sentence = sentence self.ix_sent = ix if sentence_offsets else ix - sentence.sentence_start @property def ix_doc(self): return self.ix_sent + self.sentence.sentence_start @property def text(self): return self.sentence.text[self.ix_sent] def __repr__(self): return str((self.ix_sent, self.text)) class NER: def __init__(self, ner, sentence, sentence_offsets=False): self.span = Span(ner[0], ner[1], sentence, sentence_offsets) self.label = ner[2] def __repr__(self): return f"{self.span.__repr__()}: {self.label}" def __eq__(self, other): return self.span == other.span and self.label == other.label def to_json(self): return list(self.span.span_doc) + [self.label] class PredictedNER(NER): def __init__(self, ner, sentence, sentence_offsets=False): "The input should be a list: [span_start, span_end, label, raw_score, softmax_score]." super().__init__(ner, sentence, sentence_offsets) self.raw_score = ner[3] self.softmax_score = ner[4] def __repr__(self): return super().__repr__() + f" with confidence {self.softmax_score:0.4f}" def to_json(self): return super().to_json() + [ format_float(self.raw_score), format_float(self.softmax_score), ] class Relation: def __init__(self, relation, sentence, sentence_offsets=False): start1, end1 = relation[0], relation[1] start2, end2 = relation[2], relation[3] label = relation[4] span1 = Span(start1, end1, sentence, sentence_offsets) span2 = Span(start2, end2, sentence, sentence_offsets) self.pair = (span1, span2) self.label = label def __repr__(self): return f"{self.pair[0].__repr__()}, {self.pair[1].__repr__()}: {self.label}" def __eq__(self, other): return (self.pair == other.pair) and (self.label == other.label) def to_json(self): return list(self.pair[0].span_doc) + list(self.pair[1].span_doc) + [self.label] class PredictedRelation(Relation): def __init__(self, relation, sentence, sentence_offsets=False): "Input format: [start_1, end_1, start_2, end_2, label, raw_score, softmax_score]." super().__init__(relation, sentence, sentence_offsets) self.raw_score = relation[5] self.softmax_score = relation[6] def __repr__(self): return super().__repr__() + f" with confidence {self.softmax_score:0.4f}" def to_json(self): return super().to_json() + [ format_float(self.raw_score), format_float(self.softmax_score), ] ================================================ FILE: span_model/data/dataset_readers/span_model.py ================================================ import json import logging import pickle as pkl import warnings from typing import Any, Dict from allennlp.common.file_utils import cached_path from allennlp.data.dataset_readers.dataset_reader import DatasetReader from allennlp.data.dataset_readers.dataset_utils import enumerate_spans from allennlp.data.fields import ( AdjacencyField, LabelField, ListField, MetadataField, SpanField, TextField, ) from allennlp.data.instance import Instance from allennlp.data.token_indexers import SingleIdTokenIndexer, TokenIndexer from allennlp.data.tokenizers import Token from overrides import overrides from span_model.data.dataset_readers.document import Document, Sentence logger = logging.getLogger(__name__) # pylint: disable=invalid-name class SpanModelDataException(Exception): pass @DatasetReader.register("span_model") class SpanModelReader(DatasetReader): """ Reads a single JSON-formatted file. This is the same file format as used in the scierc, but is preprocessed """ def __init__( self, max_span_width: int, token_indexers: Dict[str, TokenIndexer] = None, **kwargs, ) -> None: super().__init__(**kwargs) # New self.is_train = False print("#" * 80) self._max_span_width = max_span_width self._token_indexers = token_indexers or {"tokens": SingleIdTokenIndexer()} @overrides def _read(self, file_path: str): # if `file_path` is a URL, redirect to the cache file_path = cached_path(file_path) with open(file_path, "r") as f: lines = f.readlines() self.is_train = "train" in file_path # New for line in lines: # Loop over the documents. doc_text = json.loads(line) instance = self.text_to_instance(doc_text) yield instance def _too_long(self, span): return span[1] - span[0] + 1 > self._max_span_width def _process_ner(self, span_tuples, sent): ner_labels = [""] * len(span_tuples) for span, label in sent.ner_dict.items(): if self._too_long(span): continue # New if span not in span_tuples: continue ix = span_tuples.index(span) ner_labels[ix] = label return ner_labels def _process_relations(self, span_tuples, sent): relations = [] relation_indices = [] # Loop over the gold spans. Look up their indices in the list of span tuples and store # values. for (span1, span2), label in sent.relation_dict.items(): # If either span is beyond the max span width, skip it. if self._too_long(span1) or self._too_long(span2): continue # New if (span1 not in span_tuples) or (span2 not in span_tuples): continue ix1 = span_tuples.index(span1) ix2 = span_tuples.index(span2) relation_indices.append((ix1, ix2)) relations.append(label) return relations, relation_indices def _process_sentence(self, sent: Sentence, dataset: str): # Get the sentence text and define the `text_field`. sentence_text = [self._normalize_word(word) for word in sent.text] text_field = TextField( [Token(word) for word in sentence_text], self._token_indexers ) # Enumerate spans. spans = [] for start, end in enumerate_spans( sentence_text, max_span_width=self._max_span_width ): spans.append(SpanField(start, end, text_field)) # New # spans = spans[:len(spans)//2] # bug: deliberately truncate # labeled:Set[Tuple[int, int]] = set([span for span,label in sent.ner_dict.items()]) # for span_pair, label in sent.relation_dict.items(): # labeled.update(span_pair) # existing:Set[Tuple[int, int]] = set([(s.span_start, s.span_end) for s in spans]) # for start, end in labeled: # if (start, end) not in existing: # spans.append(SpanField(start, end, text_field)) span_field = ListField(spans) span_tuples = [(span.span_start, span.span_end) for span in spans] # Convert data to fields. # NOTE: The `ner_labels` and `coref_labels` would ideally have type # `ListField[SequenceLabelField]`, where the sequence labels are over the `SpanField` of # `spans`. But calling `as_tensor_dict()` fails on this specific data type. Matt G # recognized that this is an AllenNLP API issue and suggested that represent these as # `ListField[ListField[LabelField]]` instead. fields = {} fields["text"] = text_field fields["spans"] = span_field if sent.ner is not None: ner_labels = self._process_ner(span_tuples, sent) fields["ner_labels"] = ListField( [ LabelField(entry, label_namespace=f"{dataset}__ner_labels") for entry in ner_labels ] ) if sent.relations is not None: relation_labels, relation_indices = self._process_relations( span_tuples, sent ) fields["relation_labels"] = AdjacencyField( indices=relation_indices, sequence_field=span_field, labels=relation_labels, label_namespace=f"{dataset}__relation_labels", ) return fields def _process_sentence_fields(self, doc: Document): # Process each sentence. sentence_fields = [ self._process_sentence(sent, doc.dataset) for sent in doc.sentences ] # Make sure that all sentences have the same set of keys. first_keys = set(sentence_fields[0].keys()) for entry in sentence_fields: if set(entry.keys()) != first_keys: raise SpanModelDataException( f"Keys do not match across sentences for document {doc.doc_key}." ) # For each field, store the data from all sentences together in a ListField. fields = {} keys = sentence_fields[0].keys() for key in keys: this_field = ListField([sent[key] for sent in sentence_fields]) fields[key] = this_field return fields @overrides def text_to_instance(self, doc_text: Dict[str, Any]): """ Convert a Document object into an instance. """ doc = Document.from_json(doc_text) # Make sure there are no single-token sentences; these break things. sent_lengths = [len(x) for x in doc.sentences] if min(sent_lengths) < 2: msg = ( f"Document {doc.doc_key} has a sentence with a single token or no tokens. " "This may break the modeling code." ) warnings.warn(msg) fields = self._process_sentence_fields(doc) fields["metadata"] = MetadataField(doc) return Instance(fields) @overrides def _instances_from_cache_file(self, cache_filename): with open(cache_filename, "rb") as f: for entry in pkl.load(f): yield entry @overrides def _instances_to_cache_file(self, cache_filename, instances): with open(cache_filename, "wb") as f: pkl.dump(instances, f, protocol=pkl.HIGHEST_PROTOCOL) @staticmethod def _normalize_word(word): if word == "/." or word == "/?": return word[1:] else: return word ================================================ FILE: span_model/predictors/__init__.py ================================================ from span_model.predictors.span_model import SpanModelPredictor ================================================ FILE: span_model/predictors/span_model.py ================================================ from typing import List import numpy as np import warnings from overrides import overrides import numpy import json from allennlp.common.util import JsonDict from allennlp.nn import util from allennlp.data import Batch from allennlp.data import DatasetReader from allennlp.models import Model from allennlp.predictors.predictor import Predictor @Predictor.register("span_model") class SpanModelPredictor(Predictor): """ Predictor for SpanModel model. If model was trained on coref, prediction is done on a whole document at once. This risks overflowing memory on large documents. If the model was trained without coref, prediction is done by sentence. """ def __init__(self, model: Model, dataset_reader: DatasetReader) -> None: super().__init__(model, dataset_reader) def predict(self, document): return self.predict_json({"document": document}) def predict_tokenized(self, tokenized_document: List[str]) -> JsonDict: instance = self._words_list_to_instance(tokenized_document) return self.predict_instance(instance) @overrides def dump_line(self, outputs): # Need to override to tell Python how to deal with Numpy ints. return json.dumps(outputs, default=int) + "\n" # TODO: Can this be implemented in `forward_on_instance` instead? @overrides def predict_instance(self, instance): """ An instance is an entire document, represented as a list of sentences. """ model = self._model cuda_device = model._get_prediction_device() # Try to predict this batch. try: dataset = Batch([instance]) dataset.index_instances(model.vocab) model_input = util.move_to_device(dataset.as_tensor_dict(), cuda_device) prediction = model.make_output_human_readable( model(**model_input) ).to_json() # If we run out of GPU memory, warn user and indicate that this document failed. # This way, prediction doesn't grind to a halt every time we run out of GPU. except RuntimeError as err: # doc_key, dataset, sentences, message metadata = instance["metadata"].metadata doc_key = metadata.doc_key msg = ( f"Encountered a RunTimeError on document {doc_key}. Skipping this example." f" Error message:\n{err.args[0]}." ) warnings.warn(msg) prediction = metadata.to_json() prediction["_FAILED_PREDICTION"] = True return prediction ================================================ FILE: span_model/training/f1.py ================================================ """ Function to compute F1 scores. """ def safe_div(num, denom): if denom > 0: return num / denom else: return 0 def compute_f1(predicted, gold, matched): precision = safe_div(matched, predicted) recall = safe_div(matched, gold) f1 = safe_div(2 * precision * recall, precision + recall) return precision, recall, f1 ================================================ FILE: span_model/training/ner_metrics.py ================================================ from overrides import overrides from typing import Optional import torch from allennlp.training.metrics.metric import Metric from span_model.training.f1 import compute_f1 # TODO: Need to use the decoded predictions so that we catch the gold examples longer than # the span boundary. class NERMetrics(Metric): """ Computes precision, recall, and micro-averaged F1 from a list of predicted and gold labels. """ def __init__(self, number_of_classes: int, none_label: int = 0): self.number_of_classes = number_of_classes self.none_label = none_label self.reset() @overrides def __call__( self, predictions: torch.Tensor, gold_labels: torch.Tensor, mask: Optional[torch.Tensor] = None, ): predictions = predictions.cpu() gold_labels = gold_labels.cpu() mask = mask.cpu() for i in range(self.number_of_classes): if i == self.none_label: continue self._true_positives += ( ((predictions == i) * (gold_labels == i) * mask.bool()).sum().item() ) self._false_positives += ( ((predictions == i) * (gold_labels != i) * mask.bool()).sum().item() ) self._true_negatives += ( ((predictions != i) * (gold_labels != i) * mask.bool()).sum().item() ) self._false_negatives += ( ((predictions != i) * (gold_labels == i) * mask.bool()).sum().item() ) @overrides def get_metric(self, reset=False): """ Returns ------- A tuple of the following metrics based on the accumulated count statistics: precision : float recall : float f1-measure : float """ predicted = self._true_positives + self._false_positives gold = self._true_positives + self._false_negatives matched = self._true_positives precision, recall, f1_measure = compute_f1(predicted, gold, matched) # Reset counts if at end of epoch. if reset: self.reset() return precision, recall, f1_measure @overrides def reset(self): self._true_positives = 0 self._false_positives = 0 self._true_negatives = 0 self._false_negatives = 0 ================================================ FILE: span_model/training/relation_metrics.py ================================================ from overrides import overrides from allennlp.training.metrics.metric import Metric from span_model.training.f1 import compute_f1 class RelationMetrics(Metric): """ Computes precision, recall, and micro-averaged F1 from a list of predicted and gold spans. """ def __init__(self): self.reset() # TODO: This requires decoding because the dataset reader gets rid of gold spans wider # than the span width. So, I can't just compare the tensor of gold labels to the tensor of # predicted labels. @overrides def __call__(self, predicted_relation_list, metadata_list): for predicted_relations, metadata in zip( predicted_relation_list, metadata_list ): gold_relations = metadata.relation_dict self._total_gold += len(gold_relations) self._total_predicted += len(predicted_relations) for (span_1, span_2), label in predicted_relations.items(): ix = (span_1, span_2) if ix in gold_relations and gold_relations[ix] == label: self._total_matched += 1 @overrides def get_metric(self, reset=False): precision, recall, f1 = compute_f1( self._total_predicted, self._total_gold, self._total_matched ) # Reset counts if at end of epoch. if reset: self.reset() return precision, recall, f1 @overrides def reset(self): self._total_gold = 0 self._total_predicted = 0 self._total_matched = 0 class SpanPairMetrics(RelationMetrics): @overrides def __call__(self, predicted_relation_list, metadata_list): for predicted_relations, metadata in zip( predicted_relation_list, metadata_list ): gold_relations = metadata.relation_dict self._total_gold += len(gold_relations) self._total_predicted += len(predicted_relations) for (span_1, span_2), label in predicted_relations.items(): ix = (span_1, span_2) if ix in gold_relations: self._total_matched += 1 ================================================ FILE: training_config/config.jsonnet ================================================ { "data_loader": { "sampler": { "type": "random" } }, "dataset_reader": { "max_span_width": 8, "token_indexers": { "bert": { "max_length": 512, "model_name": "bert-base-uncased", "type": "pretrained_transformer_mismatched" } }, "type": "span_model" }, "model": { "embedder": { "token_embedders": { "bert": { "max_length": 512, "model_name": "bert-base-uncased", "type": "pretrained_transformer_mismatched" } } }, "feature_size": 20, "feedforward_params": { "dropout": 0.4, "hidden_dims": 150, "num_layers": 2 }, "initializer": { "regexes": [ [ "_span_width_embedding.weight", { "type": "xavier_normal" } ] ] }, "loss_weights": { "ner": 1.0, "relation": 1 }, "max_span_width": 8, "module_initializer": { "regexes": [ [ ".*weight", { "type": "xavier_normal" } ], [ ".*weight_matrix", { "type": "xavier_normal" } ] ] }, "modules": { "ner": { }, "relation": { "spans_per_word": 0.5, "use_distance_embeds": true, "use_pruning": true, } }, "span_extractor_type": "endpoint", "target_task": "relation", "type": "span_model", "use_span_width_embeds": true }, "trainer": { "checkpointer": { "num_serialized_models_to_keep": 1 }, "cuda_device": 0, "grad_norm": 5, "learning_rate_scheduler": { "type": "slanted_triangular" }, "num_epochs": 10, "optimizer": { "lr": 0.001, "parameter_groups": [ [ [ "_matched_embedder" ], { "finetune": true, "lr": 5e-05, "weight_decay": 0.01 } ], [ [ "scalar_parameters" ], { "lr": 0.01 } ] ], "type": "adamw", "weight_decay": 0 }, "validation_metric": "+MEAN__relation_f1" }, "numpy_seed": 0, "pytorch_seed": 0, "random_seed": 0, "test_data_path": "", "train_data_path": "", "validation_data_path": "" }