ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | PASS | download_stamp > now() - 6 MONTH | 1.2 months ago |
| History drop | PASS | isNull(history_drop_reason) | No drop reason |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | ||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://www.thecrimson.com/article/2016/2/18/mit-harvard-scrutiny/ | ||||||||||||||||||||||||
| Last Crawled | 2026-04-27 14:28:24 (1 month ago) | ||||||||||||||||||||||||
| First Indexed | 2016-10-12 04:45:57 (9 years ago) | ||||||||||||||||||||||||
| HTTP Status Code | 200 | ||||||||||||||||||||||||
| Content | |||||||||||||||||||||||||
| Meta Title | Harvard Institute of Technology | Magazine | The Harvard Crimson | ||||||||||||||||||||||||
| Meta Description | null | ||||||||||||||||||||||||
| Meta Canonical | null | ||||||||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | ||||||||||||||||||||||||
| Markdown | heavy column, fetched on demand | ||||||||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | ||||||||||||||||||||||||
| ML Classification | |||||||||||||||||||||||||
| ML Categories |
Raw JSON{
"/Jobs_and_Education": 627,
"/Jobs_and_Education/Education": 620,
"/Jobs_and_Education/Education/Colleges_and_Universities": 547,
"/Games": 349,
"/People_and_Society": 186,
"/Computers_and_Electronics": 158,
"/Games/Educational_Games": 140,
"/People_and_Society/Social_Sciences": 133
} | ||||||||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Article": 911,
"/Article/Story": 378
} | ||||||||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 995
} | ||||||||||||||||||||||||
| Content Metadata | |||||||||||||||||||||||||
| Language | null | ||||||||||||||||||||||||
| Author | null | ||||||||||||||||||||||||
| Publish Time | not set | ||||||||||||||||||||||||
| Original Publish Time | 2016-02-18 00:00:00 (10 years ago) | ||||||||||||||||||||||||
| Republished | No | ||||||||||||||||||||||||
| Word Count (Total) | 5,530 | ||||||||||||||||||||||||
| Word Count (Content) | 5,356 | ||||||||||||||||||||||||
| Links | |||||||||||||||||||||||||
| External Links | 5 | ||||||||||||||||||||||||
| Internal Links | 33 | ||||||||||||||||||||||||
| Technical SEO | |||||||||||||||||||||||||
| Meta Nofollow | No | ||||||||||||||||||||||||
| Meta Noarchive | No | ||||||||||||||||||||||||
| JS Rendered | No | ||||||||||||||||||||||||
| Redirect Target | null | ||||||||||||||||||||||||
| Performance | |||||||||||||||||||||||||
| Download Time (ms) | 164 | ||||||||||||||||||||||||
| TTFB (ms) | 162 | ||||||||||||||||||||||||
| Download Size (bytes) | 42,637 | ||||||||||||||||||||||||
| Location | |||||||||||||||||||||||||
| Host ID | 81 (laksa081) | ||||||||||||||||||||||||
| Partition ID | 95 | ||||||||||||||||||||||||
| Root Hash | 7740411923595219081 | ||||||||||||||||||||||||
| Unparsed URL | com,thecrimson!www,/article/2016/2/18/mit-harvard-scrutiny/ s443 | ||||||||||||||||||||||||