您现在的位置是:首页 > 正文

微博数据处理——获取广告用户数据集(三)

2024-04-01 00:11:14阅读 2

任务:需要获取广告用户候选的数据集

实现思路:

1.在微博话题中筛选含广告用户较多的话题

2.使用python爬虫技术获取话题用户账号

3.获取用户行为信息,并进行手工标注

1.筛选广告话题

通过对微博的使用,发现购物分享类话题广告用户较多

话题链接如下:https://weibo.com/p/100808ad1339d43994fdc06618aa28e5ec38f1/super_index

2.获取广告用户

通过对网页结构分析可知

每一页加载时初始加载一次,动态加载两次

动态加载时调用ajax进行加载,主要参数如下

pagebar:为动态加载时参数(0或1)

page:当前页数

pre_page:和当前页数值相同

current_page:当前的块页,第一页动态加载的第一块值为1,第二块为2;第二页动态加载的第一块值为4,第二块值为5

since_

网站文章

  • cesium 雾 天气 案例

    cesium 雾 天气 案例

    获取 AccessToken 代码

    2024-04-01 00:11:07
  • 2020-02-06-Linux设备驱动开发0-环境搭建

    layout title subtitle date author header-img catalog tags post Linux设备驱动开发0-环境搭建 学习Linux驱动开发,当然得有一个自己的练兵台了! 2020-02-06 Tupelo Shen img/post-bg-re-vs-ng2....

    2024-04-01 00:11:00
  • MAC PHP 版本管理

    brew installbrew-php-switcherbrew install php@7.2brew install php@7.3切换到php7.2brew-php-switcher 7.2切换到php7.3brew-php-switcher 7.3

    2024-04-01 00:10:53
  • AtCoder Beginner Contest 302——A-E题讲解

    蒟蒻来讲题,还望大家喜。若哪有问题,大家尽可提!Hello, 大家好哇!本讲解一下这场比赛的!

    2024-04-01 00:10:27
  • C/C++语言:判断是否是素数

    判断任一个正整数n是否是素数

    2024-04-01 00:10:22
  • 使用JavaScript创建和设置HTML表格

    使用JavaScript创建和设置HTML表格

    要在JavaScript中创建和设置HTML表格,您可以使用DOM(文档对象模型)来操作HTML元素。下面是一个示例代码,演示如何使用JavaScript创建一个简单的表格并设置一些样式。您可以根据需...

    2024-04-01 00:10:16
  • 6.工厂模式_2:实现改良版本

    跟汤老师学Java笔记:工厂模式实现改良版本 完成:第一遍 1.工厂模式改良版本如何实现? package designPattern; import java.io.BufferedReader; ...

    2024-04-01 00:09:52
  • linux中通过dbca创建oracle数据库

    linux中通过dbca创建oracle数据库

    本文承接上篇博客,linux中安装oracle数据库1.首先还是一样的,本地的xstar连接上服务器,2.#非常重要,必须在oracle用户下执行这行命令,否则会导致你弹出的安装oracle界面全是框框export LANG=en_US.UTF-8#这边的ip要填你自己安装xstart自己电脑上面的ipexport DISPLAY=192.168.5.108:0.03...

    2024-04-01 00:09:40
  • L1-054 福到了 (15 分)

    “福”字倒着贴,寓意“福到”。不论到底算不算民俗,本题且请你编写程序,把各种汉字倒过来输出。这里要处理的每个汉字是由一个 N×N 的网格组成的,网格中的元素或者为字符@或者为空格。而倒过来的汉字所用的...

    2024-04-01 00:09:34
  • C#基础(三十八)详细介绍委托、回调:一个类调用另一个类的方法

    一、简介 在基于Prism的MVVM架构中,用到了Socket通信作为Server。SocketClass类定义了单例模式,然后在软件启动的时候,就加载SocketClass并一直监听Client的消息。该消息包行了不同的标志,根据标志值加载不同类的方法。也就是加载View.xaml对应的ViewModel.cs。 那么问题来了,如何加载其他类(ViewModel...

    2024-04-01 00:09:07