您现在的位置是:首页 > 正文

分享几个大数据相关岗位的职责和面试问题

2024-02-29 12:29:01阅读 1

现在大数据行业如此火爆,国家和企业都需要发展大数据技术,但是人才高度稀缺,企业用人难!

而大学生们有出现这样的问题:就业难。有的岗位可能面临着几百个人竞争的情况,今天小编带大家来看看大数据相关岗位的职责和面试问题有哪些

489034603

根据业务的不同,岗位职责大概分为:

1、平台搭建类

· 数据计算平台搭建,基础算法实现,当然,要求支持大样本量、高维度数据,所以可能还需要底层开发、并行计算、分布式计算等方面的知识;

2、算法研究类

·文本挖掘,如领域知识图谱构建、垃圾短信过滤等;

·推荐,广告推荐、APP 推荐、题目推荐、新闻推荐等;

·排序,搜索结果排序、广告排序等;

·其它,· 广告投放效果分析;· 互联网信用评价;· 图像识别、理解。

3、数据挖掘类

· 商业智能,如统计报表;

· 用户体验分析,预测流失用户。

以上就是大数据的一些相关岗位职责,小伙伴会哪些了呢?又能从事哪个方面的工作呢?

下面小编再来看看面试中会实际遇到的一些问题 (这是小编亲自经历过的,各位面试的时候也会有极大的概率遇到同样的问题)

1、你在研究/项目/实习经历中主要用过哪些机器学习/数据挖掘的算法?

2、你熟悉的机器学习/数据挖掘算法主要有哪些?

3、你用过哪些机器学习/数据挖掘工具或框架?

4、基础知识

比如无监督和有监督算法的区别?· SVM 的推导,特性?多分类怎么处理?· LR 的推导,特性?· 决策树的特性?· SVM、LR、决策树的对比?· GBDT 和决策森林的区别?· 如何判断函数凸或非凸?· 解释对偶的概念。· 如何进行特征选择?· 为什么会产生过拟合,有哪些方法可以预防或克服过拟合?· 介绍卷积神经网络,和 DBN 有什么区别?· 采用 EM 算法求解的模型有哪些,为什么不用牛顿法或梯度下降法?· 用EM 算法推导解释 Kmeans。· 用过哪些聚类算法,解释密度聚类算法。· 聚类算法中的距离度量有哪些?· 如何进行实体识别?· 解释贝叶斯公式和朴素贝叶斯分类等等

5、开放问题

比如给你公司内部群组的聊天记录,怎样区分出主管和员工?

如何评估网站内容的真实性(针对代刷、作弊类)?

深度学习在推荐系统上可能有怎样的发挥?

路段平均车速反映了路况,在道路上布控采集车辆速度,如何对路况做出合理估计?采集数据中的异常值如何处理?

如何根据语料计算两个词词义的相似度?

好了,对于这个问题小编先讲到这里(当然,不会只有这些问题,每个公司的侧重点不同,在面试的时候会更趋向于公司所需要涉及的部分),小伙伴可以根据以上的问题发现自己的不足,完善自己,在这也希望各位都能找到一份满意的工作。。

 

网站文章

  • Java-100天知识进阶-JVM内存-知识铺(三)

    Java-100天知识进阶-JVM内存-知识铺(三)

    知识铺: 致力于打造轻知识点,持续更新每次的知识点较少,阅读不累。不占太多时间,不停的来唤醒你记忆深处的知识点。Java内存模型(JMM)JVM内存模式是JVM的内存分区Java内存模式是一种虚拟机规范1.Jvm内存按照运行时态及内存规范划分Java内存区域2.1 线程安全 2.1.1 程序计数器2.1.2 虚拟机栈2.1.3 本地方法2.2 线程不安全2.2.1 方法区2...

    2024-02-29 12:28:54
  • JS验证用户名密码

    JS验证用户名密码大全。 JS的常用正则表达式 验证密码用户名等JS正则 JS的正则表达式 //校验是否全由数字组成 function isDigit(s) { var patrn=/^[0-9]{1,20}$/; if (!patrn.exec(s)) return false return true } //校验登录名:只能输入5-20个

    2024-02-29 12:28:23
  • Eclipse报“Some projects cannot be imported because they already exist in the workspace”错误的解决方案

    Eclipse报“Some projects cannot be imported because they already exist in the workspace”错误的解决方案

    “Some projects cannot be imported because they already exist in the workspace” 出现这种问题一般是因为你的工作空间选错了,...

    2024-02-29 12:28:16
  • Java核心技术 卷一 第9章 集合

    目录Java集合框架将集合的接口与实现分离Collection接口迭代器泛型实用方法集合框架中的接口具体的集合链表数组列表散列集数集队列与双端队列优先级队列映射基本映射操作更新映射项映射视图弱散列映射链接散列集与映射枚举集与映射标识散列映射视图与包装器轻量级集合包装器子范围不可修改的视图同...

    2024-02-29 12:28:10
  • ALGORITHMS FOR SOURCE LOCALIZATION

    ALGORITHMS FOR SOURCE LOCALIZATION

    Two approaches for source localization, namely, nonlinear and linear, are presented in Sections 2.3....

    2024-02-29 12:28:05
  • Maven进阶-配置仓库

    Maven进阶-配置仓库

    1.1maven介绍 Maven是一个项目管理和综合工具。Maven提供了开发人员构建一个完整的生命周期框架。开发团队可以自动完成项目的基础工具建设,Maven使用标准的目录结构和默认构建生命周期。主...

    2024-02-29 12:27:37
  • 动态代理初步了解

    动态代理初步了解

    模拟某企业用户管理业务,需包含用户登录,用户删除,用户查询功能,并要统计每个功能的耗时。

    2024-02-29 12:27:28
  • 【Yarn】Yarn HA 高可用集群

    【Yarn】Yarn HA 高可用集群

    背景ResourceManager负责资源管理和应用的调度,是YARN的核心组件,集群的主角色。在Hadoop 2. 4之前, ResourceManager是YARN群集中的SPOF ( Singl...

    2024-02-29 12:27:21
  • java时间格式去.0

    java时间格式去.0

    DateFormat df = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");Date date= df.parse(b.getdDateTime());String Datetime = df.format(date);b.setdDateTime(Datetime);样例如:有时候数据库的时间与正常时间对不上 可能...

    2024-02-29 12:26:50
  • SpringMVC获取各种类型的请求数据

    文章目录SpringMVC获取各种类型请求数据获取字符串,包装类型获取自定义对象获取数组获取集合获取Data SpringMVC获取各种类型请求数据 直接control方法的参数列表写出来就可以了,S...

    2024-02-29 12:26:42