爬虫入门L2 | 网页结构&元素标签位置

用上次L1作业的文档地址作为分析页面:
//www.greatytc.com/p/0c007dbbf728

L1作业页面

先看网页结构

网页结构

网页的四个部分
<!DOCTYPE html> 这是说浏览器支持IE6-9?
<html>...</html>文档起终点
<head>...</head>文档头部
<body>...</body>文档主体

<head>部分

必须的包含的<title>元素:


head的title元素
<body>部分

body内容比较多,上张结构图看起来清晰点:

body.png

然后是各个元素的位置信息:

全局顶部导航栏.png
title.png
作者区域.png
文章内容.png
页脚的专辑名称和版权信息.png
关注的作者信息.png
赞赏作者区.png
底部喜欢分享区.png
评论区.png
侧边栏.png
最下面灰色区域的收入专题.png
最下面灰色区域的推荐专题.png

然后查看了下元素id属性,
在查看器搜索id,出现35个id,大部分在head里面。还有在文档的网页里面。这里选取一个参考。

id属性.png

最下面能看到树状索引。


树状索引.png

L2还有部分内容需要消化,html基础知识还要补起来。

之后继续补充。。。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一:在制作一个Web应用或Web站点的过程中,你是如何考虑他的UI、安全性、高性能、SEO、可维护性以及技术因素的...
    Arno_z阅读 4,987评论 0 1
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,308评论 19 139
  • 简介网络浏览器很可能是使用最广的软件。在这篇入门文章中,我将会介绍它们的幕后工作原理。我们会了解到,从您在地址栏输...
    wengjq阅读 6,286评论 2 15
  • 1. 介绍 浏览器可能是最广泛使用的软件。本书将介绍浏览器的工作原理。我们将看到,当你在地址栏中输入google....
    康斌阅读 6,195评论 7 18
  • 1.2.3.4.5.6.7,我是大耳朵图图------每晚必陪侄儿看的动画片。偶然看到一集关于爸爸教图图如何辨认长...
    林燕妮2020阅读 3,836评论 2 1