ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 0.2 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | ||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://engineering.fb.com/2018/12/14/ai-research/pytext-open-source-nlp-framework/ | ||||||||||||||||||||||||
| Last Crawled | 2026-05-27 01:47:08 (7 days ago) | ||||||||||||||||||||||||
| First Indexed | 2020-10-28 04:32:26 (5 years ago) | ||||||||||||||||||||||||
| HTTP Status Code | 200 | ||||||||||||||||||||||||
| Content | |||||||||||||||||||||||||
| Meta Title | Open-sourcing PyText for faster NLP development | ||||||||||||||||||||||||
| Meta Description | We are open-sourcing PyText, a framework for natural language processing. PyText is built on PyTorch and it makes it faster and easier to build deep learning models for NLP. | ||||||||||||||||||||||||
| Meta Canonical | null | ||||||||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | ||||||||||||||||||||||||
| Markdown | heavy column, fetched on demand | ||||||||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | ||||||||||||||||||||||||
| ML Classification | |||||||||||||||||||||||||
| ML Categories |
Raw JSON{
"/Computers_and_Electronics": 960,
"/Computers_and_Electronics/Software": 887,
"/Computers_and_Electronics/Software/Open_Source": 802,
"/Internet_and_Telecom": 136,
"/Internet_and_Telecom/Web_Services": 126,
"/Science": 108,
"/Science/Computer_Science": 106,
"/Science/Computer_Science/Machine_Learning_and_Artificial_Intelligence": 104
} | ||||||||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Article": 980,
"/Article/Tutorial_or_Guide": 649
} | ||||||||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 986
} | ||||||||||||||||||||||||
| Content Metadata | |||||||||||||||||||||||||
| Language | en-us | ||||||||||||||||||||||||
| Author | null | ||||||||||||||||||||||||
| Publish Time | 2018-12-14 17:00:00 (7 years ago) | ||||||||||||||||||||||||
| Original Publish Time | 2018-12-14 17:00:00 (7 years ago) | ||||||||||||||||||||||||
| Republished | No | ||||||||||||||||||||||||
| Word Count (Total) | 2,140 | ||||||||||||||||||||||||
| Word Count (Content) | 1,586 | ||||||||||||||||||||||||
| Links | |||||||||||||||||||||||||
| External Links | 38 | ||||||||||||||||||||||||
| Internal Links | 60 | ||||||||||||||||||||||||
| Technical SEO | |||||||||||||||||||||||||
| Meta Nofollow | No | ||||||||||||||||||||||||
| Meta Noarchive | No | ||||||||||||||||||||||||
| JS Rendered | Yes | ||||||||||||||||||||||||
| Redirect Target | null | ||||||||||||||||||||||||
| Performance | |||||||||||||||||||||||||
| Download Time (ms) | 352 | ||||||||||||||||||||||||
| TTFB (ms) | 342 | ||||||||||||||||||||||||
| Download Size (bytes) | 22,142 | ||||||||||||||||||||||||
| Location | |||||||||||||||||||||||||
| Host ID | 72 (laksa072) | ||||||||||||||||||||||||
| Partition ID | 85 | ||||||||||||||||||||||||
| Root Hash | 3811341956669177072 | ||||||||||||||||||||||||
| Unparsed URL | com,fb!engineering,/2018/12/14/ai-research/pytext-open-source-nlp-framework/ s443 | ||||||||||||||||||||||||