ℹ️ Skipped - page is already crawled
| Filter | Status | Condition | Details |
|---|---|---|---|
| HTTP status | PASS | download_http_code = 200 | HTTP 200 |
| Age cutoff | FAIL | download_stamp > now() - 6 MONTH | 9.7 months ago |
| History drop | FAIL | isNull(history_drop_reason) | disallowed |
| Spam/ban | PASS | fh_dont_index != 1 AND ml_spam_score = 0 | ml_spam_score=0 |
| Canonical | PASS | meta_canonical IS NULL OR = '' OR = src_unparsed | Not set |
| Property | Value | |||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| URL | https://france.lxgz.org.cn/ | |||||||||||||||||||||
| Last Crawled | 2025-08-17 22:44:36 (9 months ago) | |||||||||||||||||||||
| First Indexed | 2023-03-23 04:54:43 (3 years ago) | |||||||||||||||||||||
| HTTP Status Code | 200 | |||||||||||||||||||||
| Content | ||||||||||||||||||||||
| Meta Title | 中华人民共和国驻法兰西共和国大使馆教育处 | |||||||||||||||||||||
| Meta Description | null | |||||||||||||||||||||
| Meta Canonical | null | |||||||||||||||||||||
| Boilerpipe Text | heavy column, fetched on demand | |||||||||||||||||||||
| Markdown | heavy column, fetched on demand | |||||||||||||||||||||
| Readable Markdown | heavy column, fetched on demand | |||||||||||||||||||||
| ML Classification | ||||||||||||||||||||||
| ML Categories |
Raw JSON{
"/Jobs_and_Education": 847,
"/Jobs_and_Education/Education": 840,
"/Jobs_and_Education/Education/Study_Abroad": 812,
"/Law_and_Government": 230,
"/People_and_Society": 181,
"/Law_and_Government/Government": 144,
"/Law_and_Government/Government/Embassies_and_Consulates": 141
} | |||||||||||||||||||||
| ML Page Types |
Raw JSON{
"/Core_Page": 910,
"/Core_Page/About_Page": 510
} | |||||||||||||||||||||
| ML Intent Types |
Raw JSON{
"Informational": 987,
"Navigational": 319
} | |||||||||||||||||||||
| Content Metadata | ||||||||||||||||||||||
| Language | null | |||||||||||||||||||||
| Author | null | |||||||||||||||||||||
| Publish Time | not set | |||||||||||||||||||||
| Original Publish Time | 2023-03-23 04:54:43 (3 years ago) | |||||||||||||||||||||
| Republished | No | |||||||||||||||||||||
| Word Count (Total) | 199 | |||||||||||||||||||||
| Word Count (Content) | 3 | |||||||||||||||||||||
| Links | ||||||||||||||||||||||
| External Links | 82 | |||||||||||||||||||||
| Internal Links | 50 | |||||||||||||||||||||
| Technical SEO | ||||||||||||||||||||||
| Meta Nofollow | No | |||||||||||||||||||||
| Meta Noarchive | No | |||||||||||||||||||||
| JS Rendered | No | |||||||||||||||||||||
| Redirect Target | null | |||||||||||||||||||||
| Performance | ||||||||||||||||||||||
| Download Time (ms) | 2,369 | |||||||||||||||||||||
| TTFB (ms) | 2,368 | |||||||||||||||||||||
| Download Size (bytes) | 11,751 | |||||||||||||||||||||
| Location | ||||||||||||||||||||||
| Host ID | 101 (laksa101) | |||||||||||||||||||||
| Partition ID | 58 | |||||||||||||||||||||
| Root Hash | 6651189024799671701 | |||||||||||||||||||||
| Unparsed URL | cn,org,lxgz!france,/ s443 | |||||||||||||||||||||