Examples

Schema of Report

Text Classification

    res = {
            "dataset-level":{
                "length_info": {
                    "max_text_length": np.max(lengths),
                    "min_text_length": np.min(lengths),
                    "average_text_length": np.average(lengths),
                },
                "label_info": {
                    "ratio":min(labels_to_number.values()) * 1.0 / max(labels_to_number.values()),
                    "distribution": labels_to_number,
                },
                "gender_info":gender_ratio,
                # "vocabulary_info":vocab_sorted,
                "number_of_samples":len(samples),
                "number_of_tokens":number_of_tokens,
                "hatespeech_info":hatespeech,
                "spelling_errors":len(spelling_errors),
            },
        "sample-level":sample_infos
    }

Text Pair Classification

    res = {
            "dataset-level":{
                "length_info": {
                    "max_text1_length": np.max(text1_lengths),
                    "min_text1_length": np.min(text1_lengths),
                    "average_text1_length": np.average(text1_lengths),
                    "max_text2_length": np.max(text2_lengths),
                    "min_text2_length": np.min(text2_lengths),
                    "average_text2_length": np.average(text2_lengths),
                    "text1_divided_text2":np.average(text1_divided_text2),
                },
                "label_info": {
                    "ratio": min(labels_to_number.values()) * 1.0 / max(labels_to_number.values()),
                    "distribution": labels_to_number,
                },
                "vocabulary_info":vocab_sorted,
                "number_of_samples": len(samples),
                "number_of_tokens": number_of_tokens,
                "gender_info": gender_ratio,
                "average_similarity": np.average(similarities),
                "hatespeech_info": hatespeech,
            },
        "sample-level": sample_infos
    }

Named Entity Recognition

    res = {
        "dataset-level": {
            "entity_info":{
                "avg_entity_length": avg_entityLen,
                "avg_entity_on_sentence": avg_entity_nums_inSent,
                "sentence_without_entity": len(samples) - len(chunks),
                "entity_length_distribution": entity_length_distribution,
            },
            "length_info": {
                "max_text_length": np.max(lengths),
                "min_text_length": np.min(lengths),
                "average_text_length": np.average(lengths),
            },
            "label_info": {
                "ratio": min(labels_to_number.values()) * 1.0 / max(labels_to_number.values()),
                "distribution": label_distribution, #labels_to_number,
            },
            "gender_info": gender_ratio,
            "vocabulary_info":vocab_sorted,
            "number_of_samples": len(samples),
            "number_of_tokens": number_of_tokens,
            "hatespeech_info": hatespeech,
        },
        "sample-level": sample_infos
    }

Summarization

    res = {
        "dataset-level":{
                "average_text_length":np.average(text_lengths),
                "average_summary_length":np.average(summary_lengths),
                "length_info": {
                    "max_text_length": np.max(text_lengths),
                    "min_text_length": np.min(text_lengths),
                    "average_text_length": np.average(text_lengths),
                    "max_summary_length": np.max(summary_lengths),
                    "min_summary_length": np.min(summary_lengths),
                    "average_summary_length": np.average(summary_lengths),
                },
                "number_of_samples": len(samples),
                "number_of_tokens": number_of_tokens,
                "vocabulary_info": vocab_sorted,
                "gender_info": gender_ratio,
                "hatespeech_info": hatespeech,
                **attr_avg,
        },
        "sample-level": sample_infos,
    }

Name	Name	Last commit message	Last commit date
parent directory ..
img.png	img.png
readme.md	readme.md
text_classification_report.json	text_classification_report.json
text_pair_classification_report.json	text_pair_classification_report.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Expand file tree

readme.md

Schema of Report

Text Classification

Text Pair Classification

Named Entity Recognition

Summarization

Search code, repositories, users, issues, pull requests...

FilesExpand file tree

Examples

Directory actions

More options

Directory actions

More options

Latest commit

History

Examples

Folders and files

parent directory

readme.md

Schema of Report

Text Classification

Text Pair Classification

Named Entity Recognition

Summarization

Expand file tree