ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | FAIL | download_stamp > now() - 6 MONTH | 7.9 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | ||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://dl.acm.org/doi/10.5555/1953048.2078186 | ||||||||||||||||||
| Last Crawled | 2025-10-09 01:44:36 (7 months ago) | ||||||||||||||||||
| First Indexed | 2020-03-04 17:05:38 (6 years ago) | ||||||||||||||||||
| HTTP Status Code | 200 | ||||||||||||||||||
| Content | |||||||||||||||||||
| Meta Title | Natural Language Processing (Almost) from Scratch | The Journal of Machine Learning Research | ||||||||||||||||||
| Meta Description | We propose a unified neural network architecture and learning algorithm that can be applied to various natural language processing tasks including part-of-speech tagging, chunking, named entity rec... | ||||||||||||||||||
| Meta Canonical | null | ||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | ||||||||||||||||||
| Markdown | heavy column, fetched on demand | ||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | ||||||||||||||||||
| ML Classification | |||||||||||||||||||
| ML Categories |
Raw JSON{
"/Computers_and_Electronics": 714,
"/Computers_and_Electronics/Software": 581,
"/Science": 441,
"/Science/Computer_Science": 438,
"/Science/Computer_Science/Machine_Learning_and_Artificial_Intelligence": 425,
"/Computers_and_Electronics/Software/Educational_Software": 199
} | ||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Article": 976,
"/Article/Study_or_Research_Findings": 922
} | ||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 999
} | ||||||||||||||||||
| Content Metadata | |||||||||||||||||||
| Language | en | ||||||||||||||||||
| Author | null | ||||||||||||||||||
| Publish Time | not set | ||||||||||||||||||
| Original Publish Time | 2020-03-04 17:05:38 (6 years ago) | ||||||||||||||||||
| Republished | No | ||||||||||||||||||
| Word Count (Total) | 6,693 | ||||||||||||||||||
| Word Count (Content) | 12 | ||||||||||||||||||
| Links | |||||||||||||||||||
| External Links | 167 | ||||||||||||||||||
| Internal Links | 98 | ||||||||||||||||||
| Technical SEO | |||||||||||||||||||
| Meta Nofollow | No | ||||||||||||||||||
| Meta Noarchive | Yes | ||||||||||||||||||
| JS Rendered | Yes | ||||||||||||||||||
| Redirect Target | null | ||||||||||||||||||
| Performance | |||||||||||||||||||
| Download Time (ms) | 1,868 | ||||||||||||||||||
| TTFB (ms) | 320 | ||||||||||||||||||
| Download Size (bytes) | 31,282 | ||||||||||||||||||
| Location | |||||||||||||||||||
| Host ID | 91 (laksa091) | ||||||||||||||||||
| Partition ID | 82 | ||||||||||||||||||
| Root Hash | 6385618855135636491 | ||||||||||||||||||
| Unparsed URL | org,acm!dl,/doi/10.5555/1953048.2078186 s443 | ||||||||||||||||||