├── README.md ├── 互联网 ├── 暑期实习 │ ├── 360-lk │ ├── baidu_hzq.md │ ├── bytedance凉经-wn.md │ ├── face++-lk │ ├── freewheel凉经-wn.md │ ├── hulu-wn.md │ ├── iqiyi-wn.md │ ├── lat.md │ ├── tencent_hzq.md │ ├── 京东-dn.md │ ├── 头条-chenjiayu │ ├── 头条-dn.md │ ├── 头条-lxn.md │ ├── 头条_ll.md │ ├── 微软-dn.md │ ├── 微软-lk │ ├── 微软-sjq.md │ ├── 微软-why.md │ ├── 微软面经-dy.md │ ├── 快手-lk │ ├── 滴滴数据分析凉经-wn.md │ ├── 腾讯-lk │ ├── 苹果-dn.md │ ├── 阿里小蜜-sjq.md │ └── 阿里小蜜-why.md └── 秋招 │ └── tecent_feifei ├── 国企银行 └── README.md └── 暑期实习 ├── 2018暑期实习面经.pdf ├── 360_hml.pdf ├── ali.pdf ├── tencent_hml_数据平台部.pdf ├── 【秋招】今日头条_hml.pdf ├── 【秋招】新浪微博_hml.pdf ├── 头条-GGY.pdf ├── 头条_MQ.pdf ├── 美团&阿里&腾讯.pdf ├── 美团_DUDU.pdf ├── 腾讯&美团&阿里-GGY.pdf └── 腾讯阿里面试_yh.pdf /README.md: -------------------------------------------------------------------------------- 1 | # 面经 2 | 3 | thanks to [stdiohero](https://github.com/stdiohero), [Like666](https://github.com/Like666), [luffywalf](https://github.com/luffywalf), [mengxinqi](https://github.com/mengxinqi), [dy425581723](https://github.com/dy425581723), [Sileven](https://github.com/Sileven), [TobiasLee](https://github.com/TobiasLee), [Moymix](https://github.com/Moymix) 4 | 5 | -------------------------------------------------------------------------------- /互联网/暑期实习/360-lk: -------------------------------------------------------------------------------- 1 | 一面: 2 | 面试官:介绍一下简历中的项目, 3 | 我:简单挑了两个介绍,面试官主要是做搜索的,对我的项目不是很了解,也没细问。 4 | 面试官:问了一下了解哪些有监督的机器学习算法 5 | 我:LR、SVM、K近邻、HMM、CRF 6 | 面试官:你用过决策树么? 7 | 我:了解过原理,但是实际项目中没用到过 8 | 面试官:你知道过拟合的原因是什么? 解决过拟合的手段 9 | 我:吧啦吧啦啦,反正答出来了 10 | 面试官:考你一道智力题:有8个药品,其中有1个是毒药,现在你有3只老鼠,一只老鼠可以同时吃多种药物,药物服用后一天才能看出效果(死亡/存活), 11 | 最少几天可以确定哪个是毒药? 12 | 我:想了一会,给出一种2天的解法 13 | 面试官:其实一天就可以了,不过你的整体思路是对的。 14 | 15 | 二面: 16 | 面试官:介绍一下简历中的人机对话的项目 17 | 我:大概介绍一下,不过感觉他也不是很感兴趣 18 | 面试官:给你一堆短文本,你怎么分类? 19 | 我:如果是无标注的话,抽取文本长度、文本阅读量、文本受众人群等等特征,用k-means; 如果有标注的话,用逻辑回归(最后一层用softmax多分类)。 20 | 面试官:给你2亿条ip地址,内存2G(反正就是内存不够),你怎么取出出现频率高的top-5的ip 21 | 我:将每个ip映射到一个文件里,这样读取所有ip地址后我会得到一堆的文件,每个文件的行数就代表着当前ip出现的次数,然后用堆排序得到top-5. 22 | (感觉答的面试官不是很满意)。 23 | 面试官:你平时主要用的语言是啥? 24 | 我:主要用python,但是之前也写过一些c++,现在不太熟悉了。 25 | 面试官:你手写一个二分查找吧 26 | 我:吧啦吧啦啦,反正很快写完了。 27 | 面试官:你等我叫一下hr哈,等了10分钟吧,他回来说hr下午正好去开会了,说之后联系我。 28 | 29 | 30 | -------------------------------------------------------------------------------- /互联网/暑期实习/baidu_hzq.md: -------------------------------------------------------------------------------- 1 | 一面: 2 | 1. 自我介绍 3 | 2. 介绍项目,会追问描述不清楚的地方 4 | 3. 算法题:1)已知两个有序数组,将其合并:3)有多个有序数组,将其合并 5 | 4. 介绍近期比较火的模型,回答了ELMO(由于面试官对nlp不是很了解,就没怎么细问) 6 | 7 | 二面: 8 | 1. 自我介绍+项目介绍 9 | 2. 算法题:中文分词的最大正向匹配 10 | 3. SVM和核函数 11 | 4. 列举loss函数及其优缺点 12 | 13 | 三面: 14 | 1. 自我介绍 15 | 2. 优缺点 16 | 3. 对996的看法 17 | 4. 有无人生规划 18 | -------------------------------------------------------------------------------- /互联网/暑期实习/bytedance凉经-wn.md: -------------------------------------------------------------------------------- 1 | ## 1 面试岗位:懂车帝app数据挖掘(也算算法岗) 2 | 3 | ## 2 面试内容 4 | 5 | ### 2.1 一面 6 | 7 | 面试官:一个略青涩的小哥 8 | 9 | 让自我介绍,问了以下跟项目经历有关的问题: 10 | - 机器学习里的多分类具体是哪些类别、特征是哪些特征 11 | - transR 12 | - rnn, lstm,gru 原理 13 | 14 | 手写算法题: 15 | - 堆排序 16 | - 括号匹配 17 | 18 | 19 | tf-idf: 记不住公式了,讲了一下原理,面试官表示ok 20 | 21 | ### 2.2 二面 22 | 23 | 面试官:一个表达能力很差的中年人 24 | 25 | 首先让自我介绍 26 | 27 | 然后让介绍比较了解的实验室项目,我说了机器学习的那个; 28 | 29 | 问:一些一面面试官问到过的项目细节,以及随机森林具体的算法;让把url当成结构化字符串去提取字段,统计词频(隐含意思还要考虑不规范的问题) 30 | 我:url本身就可以不规范而且不规范的很多,这么做是没有意义的(没有直接这么说 31 | 面试官:我不管我就让你写(反复表达 32 | 我:于是写了 33 | 34 | 然后问到tf-idf原理,我把等待间隙查到的公式写下来了,讲了一下原理; 35 | 面试官表示不满意,让讲一下用这个算法的整个处理流程 36 | 我:这个是大二做过的一个实验了,大概是blabla,具体我不记得了 37 | 问:你刚才提到了爬虫,那你爬虫用到哪些工具库? 38 | 我:当时用到哪些忘记了,不过我最近做实验室项目有用到过 BeautifulSoup 39 | 面试官:(沉吟许久)表示,你会去查一查,这个库不叫这个名字 40 | 我:(因为上周刚写过这个代码,肯定没记错)疑惑--那叫啥? 41 | 面试官:(一副不确定又不承认的样子)反正不叫这个名字 42 | 43 | (后来查了一下确实是beautifulsoup没错,不过import的包叫 bs4,不知道他是不是这个意思) 44 | 45 | 后来零星问了几个问题,比如数据清洗的流程,深度学习训练的参数有哪些,感觉他其实并不想听。 46 | 47 | ## 3 吐槽 48 | 比较神奇的是面试官最后说了一些逻辑难以自洽的话,交流过程略去,仅记录他表达的一些想法: 49 | - 他带的byr intern 都提前跑了,他招byr要谨慎; 50 | - 想让导师签个文件确保intern实习时长; 51 | - 担心我现在入职后8、9月份参加秋招影响工作质量; 52 | - 缺人,有hc;但不想轻易培养人,想找个**完美对口**不需要培养的。 53 | 54 | 我:(槽多无口)行吧。 -------------------------------------------------------------------------------- /互联网/暑期实习/face++-lk: -------------------------------------------------------------------------------- 1 | face++ 2 | 面试官:来我们做一道数学题:A是一个n*n的矩阵,它有n个特征 m1、m2。。。mn,且均不为0,如果矩阵B(维度:n*n)满足:BB = A,满足这样条件的矩阵B有多少种? 3 | 我:一脸懵逼,线代本来学的就不好,在那瞎写。 4 | 面试官:给你一个小提示,你觉得矩阵A满足什么性质? 5 | 我:满秩的 6 | 面试官:嗯,然后把满秩矩阵能分解成啥样的写出来,让我继续做 7 | 我:心里是十分拒绝的,开始魔法做题,面试官竟然说这个思路对了。。。后来又给了点提示,最后终于写好了。 8 | 面试官;还行,有的人提示到这都没写出来,咱们写一个算法吧,手写SGD。 9 | 我:心理想着这是什么神仙面试,脸上还是笑着说好,反正不太熟练的也写出来了。 10 | 面试官:你有什么想问我的么? 11 | 我:你们这边是做什么的哇? 12 | 面试官:机器翻译吧啦吧啦,反正我没认真听。那今天面试就到这里了,我先走了。 13 | 我:最后找了一个正式员工带我出去的。。。。 14 | 15 | 第二天中午收到了旷视hr的电话,恭喜我通过面试。一脸懵逼拒了。 16 | -------------------------------------------------------------------------------- /互联网/暑期实习/freewheel凉经-wn.md: -------------------------------------------------------------------------------- 1 | ## 1 面试岗位:sde 2 | 3 | ## 2 面试内容 4 | 5 | ### 2.1 一面 6 | 7 | - 自我介绍 8 | - 详细介绍了最近做的项目 9 | - 涉及到 tcp/ip的哪几层 10 | - 输入一个字符串判断是否为合法ip地址 11 | - ipv4 12 | - ipv6 13 | - sql join有几种 14 | - sql index 15 | - 要面试的岗位主要用c++/golang,因为我不会所以没问。 16 | 17 | ### 2.2 二面 18 | 19 | - 输入任意二维数组,返回最长递增路径的长度 20 | - 25匹马,5个赛道,求出最快的3匹马,怎么赛 21 | - 大文件每行是一个数,求最大的top n 个数 22 | - shell script: cat file | sort | uniq -c [按照count值排序这里不太会做] 23 | - spark [mapreduce原理] 24 | - 小顶堆 25 | - linux下的一些命令,如查看端口状态,僵尸进程和孤儿进程,如何杀死进程等 26 | 27 | ### 蹭了个饭,走了 28 | 29 | ### 2.3 技术manager电面 30 | 本来应该是当天面聊,但manager出差了改约了电面。 31 | 问了实验室的项目,最近刚做的项目,用到的技术栈,软件开发流程,人员调配等。以及英语能力、综合能力等。 32 | 告知前面面试官告诉我的工作内容变了,因为他们那个岗位已经找到人了,我要做别的岗。我表示ok。 33 | 然后感觉没什么问题了。 34 | 35 | ## 3 36 | 收到hr微信拒信,刚来得及看清楚内容消息就被撤回了;后续没有通知。 -------------------------------------------------------------------------------- /互联网/暑期实习/hulu-wn.md: -------------------------------------------------------------------------------- 1 | ## 一 一面面试内容 2 | 3 | 形式:电话面试 4 | 5 | 面试官首先自我介绍了一下,入职1年多。工作涉及到数据仓库和AI方面。 6 | 7 | 面试流程: 8 | - 时间:1个小时 9 | - 组成: 10 | - 自我介绍5-8分钟 11 | - 编程40-45分钟 12 | - 提问 13 | 14 | 15 | 首先让自我介绍了一下简历上的几个项目,面试官听完表示,你的经历还是跟我们组的业务有一些重合的。好的,我们接下来写代码吧。 16 | 17 | ### 1 排序算法 18 | 问:有哪些时间复杂度为 `nlogn`的排序算法? 19 | 我:快排,堆排。应该还有其他的,但是我只知道这两个。 20 | 面试官:ok,那空间复杂度是多少? 21 | 我:(抓耳挠腮)可以写完代码再说嘛? 22 | 面试官:ok 23 | 24 | 在写快排代码的时候,一边写一边给面试官解释思路。 25 | 问空间复杂度怎么解释?没答上来。 26 | 面试官:ok,时间差不多了,我们做下一个题。 27 | 28 | ### 2 找出正整数数组中,每一个数右边第一个比他大的数,如果没有则填0. 29 | 例子: 30 | ``` 31 | input: 32 | [1,3,2,6,7,1,9,5] 33 | return: 34 | [3,6,6,7,9,9,0,0] 35 | ``` 36 | 仍然是希望我先讲思路再写代码。 37 | 38 | 我:首先提出brute force的解法,面试官没让写代码,直接问能不能优化; 39 | 我:(抓耳挠腮中) 40 | 我:维护一个栈,遍历这个数组 41 | 面试官:表示认可。讲了一下栈的性质可以用来延迟计算blabla 42 | 我内心os:四国艺!听君一席话胜读十年书! 43 | 然后开始写代码。 44 | 45 | 面试官看了看说:嗯应该没啥问题。我回去再跑一下。 46 | 47 | ### 3 迷宫寻路 48 | 给定二维数组,其中0表示路,1表示墙。让从左上角走到右下角,判断几条可行的路径。 49 | 50 | 我:(试探)用递归 51 | 面试官:你想吧 52 | (过了许久) 53 | 我:…… 54 | 面试官:嗯,用递归可能比较难想;你试试动态规划的思路? 55 | 我:最后还是没想出来。 56 | 57 | ### 4 问题 58 | 面试官:ok时间快到了,你有什么问题要问我吗? 59 | 我:可以介绍一下您最近在做的项目吗? 60 | 面试官:介绍了两个。 61 | 我:如果可以进入到接下来的环节,会有几面? 62 | 面试官:至少2轮on-site面,会有现场跑代码的ide。 63 | 64 | 我:没有问题了,谢谢谢谢。 65 | 66 | ## 二 感慨 67 | 面试官超级nice, 我写代码的时候一直在看我写。 68 | 乐于在面试过程中探讨解法,让我受益良多。 69 | 好了,我滚去刷题去了。 -------------------------------------------------------------------------------- /互联网/暑期实习/iqiyi-wn.md: -------------------------------------------------------------------------------- 1 | ### 1 目标岗位:爱奇艺推荐算法 2 | 3 | ### 2 一面 4 | 5 | 面试官:一个挺和蔼的年轻小伙砸。 6 | 7 | 首先让自我介绍,我blabla,分别介绍了简历上写的机器学习、推荐系统和中文分词项目。 8 | 面试官让解释了一下知识图谱的知识表示算法,其他没问什么特别的。 9 | 10 | 问:我看你简历写的熟悉shell命令,你写一下你常用的shell命令。 11 | 我:在纸上写了 wc -l ,sed, awk, sort | uniq -c , find 等。 12 | 13 | 问:了解lightGBM, gbdt, xgboost吗? 14 | 我:大体说了一下。看对方无意让详细介绍就打住了。 15 | 16 | 问:写个快速排序吧。 17 | 我:写完了,一点一点给面试官解释思路。 18 | 19 | 问:会c++/spark scala/ hive sql 吗? 20 | 我:研究生阶段没怎么用过,后者没系统学过,但能看懂代码; 21 | 问:c语言的指针呢? 22 | 我:ditto。 23 | 面试官就没再问。 24 | 25 | 问:1亿个数字,怎么找出最大的10个? 26 | 我: 27 | 1)用spark,介绍一下原理; 28 | 2)维持一个小顶堆,遍历所有数字; 29 | 面试官:ok 30 | 31 | ### 3 二面 32 | 33 | 面试官:一个说话简略,偶尔不太耐烦的中年人。 34 | 35 | 首先让自我介绍。 36 | 37 | 其次问了一下机器学习项目的特征有哪些,多分类具体是哪些类别。 38 | 39 | 问:是否了解推荐算法 40 | 我:有FM, 协同过滤,gbdt等。 41 | 42 | 问:要做一个推荐系统要怎么做(打开手机爱奇艺示意 43 | 我:我没做过推荐系统,不过可以说一下我的理解balbla…… 44 | 面试官表示了解了。 45 | 46 | 面试官:你回去可以了解一下blabla推荐算法(此处环境嘈杂,没太听清,就听清了youtube的推荐算法,dnn等…… 47 | 又问:你有什么问题吗? 48 | 我:暗自大惊失色,不会这就是劝退了吧?弱弱地问:“我凉了吗?” 49 | 50 | 面试官摇摇头,又问了个啥我忘了。然后说,来写个代码吧。 51 | 问题:一个大文件,每一行是用户看过视频的记录,格式为 “uid \t vid”,让统计出如下格式: 52 | 53 | ``` 54 | user_1: vid1, vid2, vid3... 55 | user_2: vid4, vid6, vid8... 56 | ... 57 | ``` 58 | 59 | 我:写代码的过程中问,user这一列是排序好的吗,答是的。 60 | 后来写出来了,思路就是maintain 一个 cur_user 记录当前的user, 一个 curlist记录当前user看过的video_id;然后按行读取记录,如果当前user不同于 cur_user就把之前的记录print出来,更新cur_user & curlist. 61 | 因为面试官看起来不太耐烦了所以写完就匆匆给他看了,发现最后的一个user的list忘记输出了。 62 | 63 | 问:还有什么问题要问我吗? 64 | 我:可以简单介绍下您最近在做的一个项目吗? 65 | 面试官:打开手机爱奇艺,展示短视频推荐,表示跟抖音快手差不多,问我用没用过; 66 | 我:我在爱奇艺看《破冰行动》,抖音快手用过不过不经常看,看短视频对学生来说太耗时间了; 67 | 我:接下来还会有面试吗? 68 | 面试官:没有了,回去等消息吧。 69 | 我:谢谢谢谢。 70 | 71 | ### 4 最后的吐槽 72 | 面试官把写代码的白纸收走了,所以我一些细节也记不太清了。 -------------------------------------------------------------------------------- /互联网/暑期实习/lat.md: -------------------------------------------------------------------------------- 1 | [TOC] 2 | 3 | ### 2019年3月16日 19:00-19:30 腾讯 电话面 4 | 5 | 1. 自我介绍 6 | 7 | 2. 介绍对话系统项目 8 | 9 | 3. 详细介绍一个项目:知识库问答,问有没有利用transE等进行研究,介绍了解的相关研究 10 | 11 | 4. 过拟合的解决办法 12 | 13 | 5. 介绍dropout的用法,train和test的时候都是如何起作用的 14 | 15 | 6. 对传统机器学习有没有了解,我说不了解然后就没了 16 | 17 | 18 | 19 | ### 2019/03/27 2:00-4:30 腾讯微信搜索部 20 | 21 | 一面: 22 | 23 | 1. 单链表归并 24 | 25 | 2. 判断两棵普通树的拓扑结构是否一样 26 | 27 | 3. 介绍seq2seq模型,按代码讲 28 | 29 | 4. bp推导 30 | 31 | 二面: 32 | 33 | 1. 前序遍历中序遍历是否能建成树 34 | 35 | 2. n维数组 0–n-1的数字共n-1个,找缺失值 36 | 37 | 3. 讲项目,biLSTM,写LSTM公式 38 | 39 | 4. 讲毕设项目,有没有遇到过拟合的问题,L1为什么会变为0,L2 40 | 41 | 5. attention 42 | 43 | 6. 激活函数,知道哪些,为什么要用ReLU 44 | 45 | 46 | 47 | ### 2019/04/04 10:00-12:30 深度好奇 48 | 49 | 一面: 50 | 51 | 1. 手写tensorflow逻辑回归的代码; 52 | 2. sigmoid公式 53 | 54 | 二面: 55 | 56 | 1. 详细介绍一个项目,问的特别详细;baseline是什么;模型上有哪些创新的地方;稍微介绍了一下前面实体链接的部分,揪着这个问了很多,并不明白为啥要问我这个;知识库中关系一共有多少种;如何用关系映射改善实体链接;为什么不对候选关系去重。。 57 | 6. 算法题:n个ip段,m个ip地址,找到这m个ip地址所在的ip段 58 | 59 | 60 | 61 | ### 2019/04/16 19:00-19:30 平安科技 电话面 62 | 63 | 1. 自我介绍 64 | 2. 介绍自己印象最深的项目:KBQA,数据、模型,bert的网络结构; 65 | 3. LSTM比RNN好在哪 66 | 4. 文本padding后梯度是如何反向传播的 67 | 5. 算法题:leetcode1 two sum 68 | 6. 过拟合的解决办法 69 | 7. 样本不均衡的解决办法 70 | 8. 有一堆新闻,如何根据这些新闻判断对证券的影响 71 | 72 | 73 | 74 | ### 2019/04/21 16:00-17:00 阿里达摩院 电话面 75 | 76 | 1. 自我介绍 77 | 2. 介绍一个项目:又问我 如果让你做实体链接你要怎么做????DSSM了不了解。。。实体消歧,"苹果"要怎么链接到正确的实体上,问的我有点懵逼。。胡说了一通。。 78 | 3. 过拟合解决办法 79 | 4. L1 L2原理 80 | 5. 怎么处理正负样例不平衡的问题 81 | 6. loss不收敛怎么办 82 | 7. 除了梯度下降还知不知道别的优化算法,Adam知不知道原理 83 | 8. 除了BERT,别的预训练模型了不了解,BERT中的masked是什么,跟别的预训练模型的区别 84 | 85 | 86 | 87 | 88 | ### 2019/04/22 9:30-11:20 微软stca 89 | 90 | 一面:20多岁不知是否软萌女面试官 91 | 92 | 1. 算法题:大数相加 leetcode 415 93 | 94 | 2. 算法题:n! 95 | 96 | 3. 介绍项目: 97 | 98 | 我:blabla。。 99 | 100 | 面试官:你这个感觉很简单啊。用预训练模型稍微一调就很好了,你研究的点在哪里呢? 101 | 102 | 我无fuck说。 103 | 104 | 面试官:你平时会看一些最新的论文吗?都看哪些会议的论文? 105 | 106 | 二面:30多岁骨瘦如柴娘炮男面试官 107 | 108 | 1. 介绍项目: 109 | 110 | 我:同上blabla 111 | 112 | 面试官:感觉你这个现在效果已经很好了,后面还有什么研究计划吗 113 | 114 | 我:瞎扯了一些 115 | 116 | 面试官:你觉得这样做会比原来好在哪里呢?(面试官应该是不认同我胡扯的,反复问我你这样做能有什么改进) 117 | 118 | 2. 算法题:n个点,判断是否在两条直线上。他的提示我听不懂,没做出来。。 119 | 120 | 3. 面试官出来就说 给你个建议,要把自己研究的东西了解的更清楚一点。。。gg 121 | 122 | 123 | 124 | ### 2019/04/23 10:40-12:00 网易游戏雷火事业群 视频面 125 | 126 | 一面:10:40-11:20 30多岁成熟女面试官 127 | 128 | 1. 自我介绍 129 | 130 | 2. 每一个项目都让介绍了一遍,但是感觉也并没有问什么细节的东西,我应该是没说好,让面试官觉得没什么可问的。我记得的几个问题: 131 | 132 | 面试官:word2vec是怎么训练的?讲一下层次softmax原理?fasttext和wordvec有什么区别? 133 | 134 | 面试官:在哪些数据集上评测的呢?baseline是什么?(本科论文) 135 | 136 | 面试官:训练的时候是如何控制押韵的? (歌词生成项目) 137 | 138 | 3. 下面问了一些计算机相关的基础知识:python中的多进程和多线程;子类继承,子类重写了父类中的函数,还能不能调用父类中的同名函数;linux最常用的命令是什么?有没有用过某某某命令(她说的英文我没听清 但是应该是没用过的 她说是设置定时任务的命令)?如果服务器很卡怎么办?你会考虑从哪些方面解决这个问题?数据库了不了解?大型数据库查询很慢怎么解决?用没用过图数据库?机器学习都知道哪些算法?介绍一下kmeans。问的这些我好像就没有一个答上来的。。不出意外又要gg 139 | 140 | 4. 算法题:写一个开根号的函数。一脸懵逼,不知道怎么做,她提示说用二分或者求导???提示了也不会,她就说算了。。 141 | 142 | 5. 然后说聊点别的。好像问我实验室老师做什么方向的? 143 | 144 | 二面:20多岁年轻男面试官 145 | 146 | 1. 自我介绍 147 | 148 | 2. 也是每个项目都讲一遍,感觉他也没啥要问的。 149 | 150 | 几个问题: 151 | 152 | 面试官:用的DSTC2中哪些数据? 153 | 154 | 面试官:transformer里encoder每一层传的是什么,encoder到decoder传的是什么? 155 | 156 | 面试官:写一下seq2seq里attention的公式(还没写完视频不知道怎么就断了,然后后面就电话面了) 157 | 158 | 3. python多进程多线程 159 | 160 | 4. 算法题是leetcode括号生成那个题,说一下怎么做。 161 | 162 | 163 | 164 | ### 2019/04/28 15:30-17:00 快手 165 | 166 | 一面: 167 | 168 | 介绍项目(感觉面试官没什么可问的,可能是我到早了,临时拉了别的面试官) 169 | 170 | 二面:一个巨帅的小哥哥 171 | 172 | 介绍项目 173 | 174 | 算法题:1.旋转数组的最小值 2.最长公共子串 175 | 176 | 几个问题: 177 | 178 | 1. fasttext和word2vec的区别 179 | 2. transformer是哪里并行,self-attention和普通attention的区别 180 | 3. 句子相似度的计算,他说用triplet loss效果好 181 | 182 | 183 | 184 | ### 2019/05/05 19:00-19:35 阿里-移动与创新事业群-人工智能实验室-语音对话交互组 185 | 186 | 一面:电话面 187 | 188 | 项目一个一个说 189 | 190 | 几个问题: 191 | 192 | 1. 介绍attention 193 | 2. elmo gpt bert区别 194 | 3. 讲一下fasttext 195 | 4. 人机对话从研究到落地有多大的差距?怎么解决对话中领域切换的问题(比如天猫精灵,用户开始在进行订一机票的任务,任务还没完成就开始聊天气,然后又回到订机票任务,怎么处理这种情况)? 196 | 5. lstm和gru的区别 197 | 6. fasttext和word2vec相比的优势是什么 198 | 199 | > 面试官原话: 200 | > 201 | > 刚才问的lstm对比gru,gru原理没错,gru的结构可以并行计算,这个是一个 202 | > 203 | > fastText和word2vec,实务中,文本都是领域内的,fastText更容易通过标注控制结果 204 | 205 | 206 | 207 | 二面:2019/05/08 16:30-18:00 部门leader 208 | 209 | 1. nlp的难点在哪里? 210 | 2. 说一下你的职业规划 211 | 3. 你觉得最有挑战性的一个项目 212 | 4. cnn和lstm的区别 213 | 5. bert为什么会好 214 | 6. 两层全连接层,softmax cross entropy,写出每一层的参数更新公式 215 | 7. 中文分词,双向最大匹配算法,给定词典{"北京","天安门"},"我爱北京天安门"切分为"我 爱 北京 天安门" 216 | 217 | 218 | 219 | 三面:2019/05/09 19:00-20:00 交叉面 220 | 221 | 1. 删除链表中倒第n个结点 222 | 2. 字符串的全排列 223 | 3. 问前缀树了不了解,我说不了解直接就问下一个了 224 | 4. python 正则表达式,匹配一个字符串中的数字 225 | 5. 给定一个词典,对一个句子进行切分,比如,词典{"天安门","北京"},句子"我爱北京天安门"切分为"我爱 北京\w 天安门\w" 226 | 227 | 228 | 229 | 四面:2019/05/13 10:00-11:00 现场面 部门大leader 230 | 231 | 1. 写作水平怎么样?平时都看哪些会议的论文 232 | 2. 代码能力怎么样?和自己实验室的比怎么样? 233 | 3. 以后打算做什么样的工作? 234 | 4. 觉得目前几个大公司自己更喜欢哪家? 235 | 5. 你这个创新的点在哪里? 236 | 237 | 238 | 239 | 五面:2019/05/16 16:30-17:00 交叉面 240 | 241 | 1. 语言模型的原理,如何训练,应用 242 | 2. 如何训练出具有词法特征的词向量,如果用word2vec训练,参数如何设置 243 | 3. 最大熵模型 244 | 4. knn和kmeans 245 | 5. 介绍一个代表性的项目经历,动机、方法、结果、结论、困难、解决办法 246 | 6. 公司里一个项目,现在模型只能达到80%的正确率,现在领导想让你提高到95%以上,你会怎么做? 247 | 248 | 249 | 250 | HR面:2019/05/21 15:30-16:00 251 | 252 | 1. 介绍一个最能体现自己技术能力的项目 253 | 254 | 2. 核心竞争力是什么 255 | 256 | 3. 为什么不去腾讯实习?我没有腾讯offer啊大佬 257 | 258 | 4. 还有没有比别人优秀的地方,比如有没有参加过比赛,比别人又快又好的做出来? 259 | 260 | 5. 最后好像问我了不了解tts 261 | 262 | 263 | 264 | 收到录用意向书 2019/05/28 265 | 266 | 体检有点问题,还去复检了两次,还是身体最重要,不要在肝了 267 | 268 | 收到offer 2019/06/10 269 | 270 | 271 | 272 | ### 2019/06/02 14:00-15:00 腾讯PCG-浏览平台产品部-搜索中心-搜索数据开发组 273 | 274 | 一面:2019/06/02 14:00-15:00 275 | 276 | 自我介绍 277 | 278 | 挨个讲项目 279 | 280 | 几个问题: 281 | 282 | 1. 为什么没有分词,有没有试过分词之后的效果 283 | 2. 如何同时用词级别和字级别 284 | 3. 数据归一化,什么情况下需要 285 | 4. 过拟合解决办法 286 | 5. 梯度消失/梯度爆炸解决办法 287 | 6. L1L2正则化从数学角度分析一下 288 | 7. python多进程多线程 289 | 8. c++还会不会 290 | 9. 写一个自己觉得最难的算法 291 | 292 | 293 | 294 | 二面: 2019/06/11 10:00-10:20 295 | 296 | 让讲一个项目,也没提啥问题,没让写算法题 297 | 298 | 299 | 300 | 三面: 2019/06/12 22:00-22:20 301 | 302 | 和二面差不多,让讲一个项目,也没提啥问题,没让写算法题 303 | 304 | 记得让介绍了一下seq2seq模型 305 | 306 | 307 | 308 | HR面:2019/06/13 309 | 310 | 以后想在哪工作 311 | 312 | 为什么不去别的互联网公司 313 | 314 | 315 | 316 | 收到offer 2019/06/17 317 | 318 | 好的 有腾讯offer了 不用去杭州了 -------------------------------------------------------------------------------- /互联网/暑期实习/tencent_hzq.md: -------------------------------------------------------------------------------- 1 | PCG部门 2 | 1. 自我介绍+项目介绍 3 | 2. word2vec具体实现(skip-gram) 4 | 3. 决策树 5 | 4. 集成学习,弱学习器和强学习器 6 | 5. loss函数都有哪些 7 | 6. 梯度下降怎么优化 8 | -------------------------------------------------------------------------------- /互联网/暑期实习/京东-dn.md: -------------------------------------------------------------------------------- 1 | #### 京东 2 | 3 | 一面 4 | 5 | 算法:快排 6 | 7 | 算法:写栈 在O(1)时间内取出最小值 8 | 9 | 问s2s项目,讲attention,LSTM结构公式; 10 | 11 | cnn中的pooling作用:我觉得强调值 面试官说是平移旋转不变性 12 | 13 | CNN的反向传播是怎么做的 14 | 15 | 16 | 17 | 二面 18 | 19 | 自己的优缺点 20 | 21 | 问了比较久强化学习的项目,质疑数据是自己造的;问值迭代策略迭代,actor critic 22 | 23 | 问java多线程如何实现的 24 | 25 | 有关c++, &a[0] 与*(a+0)有什么区别 26 | 27 | 算法:之字遍历二叉树 28 | 29 | 算法: 算pai -------------------------------------------------------------------------------- /互联网/暑期实习/头条-chenjiayu: -------------------------------------------------------------------------------- 1 | 一面: 2019-06-04 2 | 面试官:简单介绍一下自己 3 | 我:吧啦吧啦吧啦 4 | 面试官:一个算法题,给你一个字符串,将它转换为int类型的数值返回 5 | 我:主要考虑了空格,和不合理字符的处理(例如合理字符只有+,-,0-9) 6 | 面试官:两个二叉树,如何判断是否为镜像二叉树 7 | 我:递归写出来了 8 | 面试官:现在有一个场景,给你一个query(由一系列的字组成)和一些返回的item,如何判断query中哪些字是关键字 9 | 我:说了一些利用NLP分词工具先分词,根据用户点击Item 的词数作为重要程度,计算一个item与词之间的相似度来判断 10 | 11 | 二面:2019-06-04 12 | (一面和二面是同一个下午) 13 | 面试官:简单介绍一下你自己 14 | 我:吧啦吧啦吧啦 15 | 面试官:你在新浪微博的实习主要是做什么 16 | 我:聊了一下项目经历(主要是根据微博用户的行为给用户打分) 17 | 面试官:好了,现在给你一批微博用户的每日的各种活动的log,你如何完成给用户打分的这个项目? 18 | 我:假设Log文件的格式,定义了一下特征分别有什么,简单说了一下把打分的任务转化为一个有标注的分类任务来做 19 | 面试官:(不满意)你写下来,详细地写你每一步怎么做的 20 | 我:吭哧吭哧地写。。。 21 | 面试官:你主要是用python?会其他的吗? 22 | 我:不会。 23 | 面试官:你觉得你全部的代码量大概有多少,从第一次到现在的全部? 24 | 我:(头脑风暴)可能有一万多,不到两万 25 | 面试官:(看了一下我写的预处理log的代码)你有没有想过,为什么要用机器学习来做这个事情,而不是用人工来做? 26 | 我:(灵魂的拷问???我怎么知道)机器学习。。。。可以交给机器去做重复的繁杂的数据处理的工作,提高效率 27 | 面试官:你觉得机器一定会比人做得好吗? 28 | 我:(感觉这一段聊崩了)....... 29 | ...(很久以后) 30 | 面试官:考你一个算法题,给定一个有序的数组,和一个数x,找数组中大于等于x的第一个数的下标 31 | 我:写了二分查找 32 | 面试官:你怎么证明你写对了 33 | 我:举了六个例子,演算了一遍算法的执行过程 34 | 面试官:一个多叉树,每一个节点有对应的权值,问这个树中是否存在一条边,把这个边去掉以后,得到的两个树的权值的和相等,存在返回True,否则返回False,定义一下存储多叉树的数据结构 35 | 我:简单说了一下想法,用一个类来存节点,int类型存节点的值,列表存节点的所有孩子节点,依次判断每一条边断开后,两个子树是否权值和相等 36 | 面试官:还有更好的方法吗? 37 | 我:我不会了 38 | (提问环节) 39 | 我:技术面有几轮,多久能有消息,转正的时间要求 40 | 面试官:技术面一般两轮,过了的话有hr面,一般一周之内有消息,转正的话,这边是要求实习满六个月才能转正,往年的转正概率会有60左右 41 | 42 | 三面(当天晚上收到了hr的电话,说要加一轮技术面,约了第二天下午)2019-06-05 43 | 面试官:简单介绍一下你自己 44 | 我:吧啦吧啦 45 | 面试官:考一个算法题,一个多叉树,每一个节点都有对应的值(不重复),求两个节点值对应的节点的最近公共父节点 46 | 我:递归写了一下 47 | 面试官:问了毕设做的项目 48 | 我:(明显察觉面试官不太懂我在做什么)介绍了一下毕设 49 | 面试官:有没有其他的offer,什么时候能来 50 | 我:。。。。。 51 | (提问环节) 52 | 我问了一下转正要求和工作内容 53 | 面试官:这边一般是满三个月就能提转正,工作内容是。。。。。。。(反正我没听懂) 54 | 55 | (HR面)三面后让我等了30分钟就到hr面了 56 | 主要是聊什么时候能来,一些找实习的期望,给了offer需要考虑多久的问题 57 | -------------------------------------------------------------------------------- /互联网/暑期实习/头条-dn.md: -------------------------------------------------------------------------------- 1 | ##### 头条一面 2 | 3 | > 介绍项目(XGBoost相关) 4 | 5 | > 具体讲一下XGBoost原理 6 | 7 | Me:大概讲了bagging boosting gbdt xgboost 框架 以及xgb改进 8 | 9 | > 好的,那我来详细问一下,gbdt常用的损失函数都有哪些 10 | 11 | Me:我只说了MSE 12 | 13 | > MSE有什么缺点 14 | 15 | ME:对异常值敏感 16 | 17 | > 为什么对异常值敏感 18 | 19 | Me:大概说下 20 | 21 | > 为什么xgboost 层次不需要很深 rf需要树层次比较深 22 | > 23 | > 机器学习 偏差 方差什么含义 24 | > 25 | > gbdt也可以做分类问题 怎么做 26 | > 27 | > 什么时候用中位数 众数 28 | > 29 | > gini系数怎么算的 30 | 31 | Me:以上答的都不全。。。 32 | 33 | > l1 l2正则 区别 34 | 35 | Me:l1是绝对值 l2是W平方 l1稀疏解 l2平滑 36 | 37 | > lda原理 38 | 39 | Me:写了下lda的公式 说了下 40 | 41 | > tfidf怎么算 42 | 43 | Me:公式 44 | 45 | > 解决小数据问题有哪些方法 46 | 47 | Me:数据上下采样 模型改进 预训练迁移学习 48 | 49 | > 算法题 做了顺时针打印二维数组 50 | 51 | -------------------------------------------------------------------------------- /互联网/暑期实习/头条-lxn.md: -------------------------------------------------------------------------------- 1 | # 头条 AI Lab 面经 2 | 3 | ## 一面 4 | 5 | 首先让自我介绍,之后主要问的是我第一个项目:中文小说实体抽取的事 6 | 7 | 由于复现的两篇论文不是深度学习的,所以讲了比较久。 8 | 9 | 第一篇…… 10 | 11 | 第二篇…… 12 | 13 | 我也讲了我怎么改进第二篇的特征 14 | 15 | 之后问了我lattice lstm是怎么work的, 16 | 17 | 我提到了lattice lstm的动机:分词之后再做实体标注,会导致 1.分词错了实体标注就错了 2.分词错了也会影响别的词的实体标注,而之前的sota是把词向量和字向量一起送到卷积里去,虽然说也是缓解了分词的错误,但lattice lstm的做法更加的“软”,实际效果更好 18 | 19 | 有一个开放性的问题,给一个集合,包含着一些实体词与非实体词,与一些文本,未分词,如何做实体抽取(无监督)? 20 | 21 | 我没思路,什么都没说出来,直接投降 22 | 23 | 之后问了如何用对抗训练的思想做梯度上升,对数据集进行增广 24 | 25 | 我提到了图像中的对抗训练,我们也假设embedding做轻微的改动,不会改变其潜在语义,这个被第一个面试官accept了,但第二个面试官那就白给了。 26 | 27 | 之后是一道leetcode原题 28 | 29 | [URL](https://leetcode-cn.com/problems/search-in-rotated-sorted-array/) 30 | 31 | 感觉虽然做过,当时自己也是直接想出了思路,但在这种面试场合下,还是会脑子不灵光,特别是边界条件。 32 | 33 | ## 二面 34 | 35 | 和一面问的很像,但是由于面试官对面试时间比较在意,以及我在一开始掉线了六分钟,很多东西我没说完,面试官就打断了。 36 | 37 | 相比一面,问了我的acl2019那篇,也没问关于常识的什么东西,问了BERT的具体模型细节,我讲了每层有自注意力机制,多头注意力,layer-normalization,残差连接。但讲的不是很清楚。 38 | 39 | 之后问我layer-normalization是什么,我说我不知道,我知道有个BN(给自己挖坑,不可取)。 40 | 41 | 之后就问我BN,然后她一问我,我才知道我连这个都不是很清楚。我讲BN是先放缩到【0,1】之内,再进行线性变换,然后说这会使每层的方差不变(实际上这是某个初始化带来的好处,我又搞错了)。 42 | 至于BN正确的解释,可以参考一下 [Blog](https://tobiaslee.top/2017/12/06/Batch-Normalization-Learning-Notes/) 43 | 44 | 45 | 46 | 然后让我写一个深层全连接网络是如何前向与后向传播的。 47 | 48 | 前向的时候,我只写了一层=线性变换(前一层),bias和激活函数都没加,面试官提醒后,我给加上了 49 | 50 | 算导数时,我sigmoid的导数写错了,(算这个导数我还是会的,但我记得答案应该也是用sigmoid的输出表示的,就强行把一些e^-x这种东西用sigmoid的输出去表示,就弄错了) 51 | 52 | 最后面试官让我写sigmoid的公式,可能她觉得我可能连这个都不知道吧,还好我这个没写错。 53 | 54 | PS: 疑似挂了 55 | 56 | 57 | -------------------------------------------------------------------------------- /互联网/暑期实习/头条_ll.md: -------------------------------------------------------------------------------- 1 | # 头条 AI Lab 2 | 3 | ## 一面 4 | 5 | 是个小姐姐,问了下论文,把三篇文章的任务讲了下,contribution 说了一下。 6 | 7 | 主要讲 Topic-to-Essay 那篇文章,中间顺带把在艾耕做的汽车评论拓展主题词(tf-idf)的方法说了。 8 | 9 | 问了下 DeeCamp 的项目,讲了下任务,嘻哈歌词的押韵怎么做,和唐诗押韵的 mask 类似。 10 | 11 | 然后小姐姐说一面还是要做个算法题,给了俩数组 A 和 B,和一个 min(i, j) 返回 min( A[i], B[j]),求 sum ( min(i, j) )。 12 | 13 | 秒写暴力 O(mn),然后优化之,排序两个数组,然后两个指针,然后类似逆序对的计算方法即可。 14 | 15 | ## 二面 16 | 17 | 这一面更像是聊天,一开始比较紧张,后来发现面试官并不在乎我知不知道,经常说没关系,我也就佛了放开聊。 18 | 19 | 面试官问我对 text generation 是不是还是蛮熟的,我说是,然后开始问相关的内容。 20 | 21 | 我说说了一些 Exposure bias 的问题,面试官说在数据量足够大的情况下,其实问题不是很大,scheduled sampling 提升不明显。 22 | 23 | Q:GAN 了解的多吗 24 | 25 | A:基本知道一些,让写了 GAN 的目标函数,说了下 WGAN 26 | 27 | Q:WGAN 的公式能推吗 28 | 29 | A:不能(逃 30 | 31 | Q:知道 VAE 吗 32 | 33 | A:知道一点,和 Seq2Seq 很类似 34 | 35 | Q:是吗,能推公式吗? 36 | 37 | A:不确定 38 | 39 | 面试官:VAE 的 latent vector 是有限制的,是一个 gaussion;Seq2Seq 没有这方面的限制。(后来发现面试官可能看了一个 VAE 的 Tutorial,补了一下就知道他在说什么了) 40 | 41 | Q:BERT 了解吗? 42 | 43 | A:知道一点,说了下 self-attention,我很好奇为什么 work(并且这里把 ELMo 和 BERT 混了) 44 | 45 | 面试官:主要是表示是 deep Contexualized 的,能够带来一些信息的增益 46 | 47 | 聊到 GPT,说把很多任务做成 Pair,然后去探索一些现象。 48 | 49 | 用 BERT 能不能给一个句子打分,我说用 language model; 50 | 51 | 问了下采样的方法知道多少,回答:不清楚。 52 | 53 | 后来聊了下研究理想,我说研究生阶段想做一些 solid 的 work,不去灌水,面试官还是蛮认可的。 54 | 55 | 最后问了下面试官怎么提升自己: 56 | 57 | 1. 多看一些 ICML、NIPS 的文章,偏应用的文章看多了会忽视背后的原理 58 | 2. Text generation 还有很多可以了解的,比如 VAE。 59 | 60 | ## HR 面 61 | 62 | 中间HR给我打电话没接到,直接加了HR小姐姐微信问怎么样了,就开始HR面。 63 | 64 | 先确认了身份(大三在读),确认实习时间。 65 | 66 | 问能不能 balance 学业和实习,我说我下学期就保研了(逃) 67 | 68 | 说大小周,年轻人就是要奋斗啊!福报懂吗 69 | 70 | 问还有没有投其他的公司,我说就投了头条,吹了一波头条,并且说 AI Lab Leader和我重名太有缘了 71 | 72 | 介绍了房补等福利,我说我基本都了解,HR 表示我工作做的很足2333 73 | 74 | 最后我问了下薪资,没说,说还要讨论(怕不是批发价Orz) 75 | 76 | -------------------------------------------------------------------------------- /互联网/暑期实习/微软-dn.md: -------------------------------------------------------------------------------- 1 | 机器学习方向 2 | 3 | 4 | 5 | 一面 6 | 7 | 1.说一个你做的最难的项目; 8 | 9 | 我:讲项目。。。可能过于简单或者方向不对口 对方没有怎么细问 10 | 11 | 面:你做对话 为什么不投小冰 12 | 13 | 我:ummm不能选组,都是大类的岗位投递。。。 14 | 15 | 2.算法题:给一个数组 长度n ;其中每个元素的值在1-n之间 ,求返回每个元素的出现次数;要求空间O(1) 16 | 17 | 我:说了一个排序的方式; 时间O(nlogn) 18 | 19 | 面:再想一下时间复杂度更低的方式 20 | 21 | 我:在面试官的引导下 写完了 22 | 23 | 面:写测试用例 24 | 25 | 我:写。。。。 26 | 27 | 28 | 29 | 二面 30 | 31 | 1.讲一个你最近做的项目 32 | 33 | 我:讲。。。。感觉面试官不是做这个的 问了几个怎么做的 就过去了 34 | 35 | 2.算法:给一颗二叉树 判断其是否是中心对称的 36 | 37 | 我:层序遍历写了一个 38 | 39 | 面:写一个递归的吧 40 | 41 | 我:递归的写完了 42 | 43 | 面:你这用了额外空间 写一个不用额外空间的 44 | 45 | 我:写了 46 | 47 | 面:写一下测试用例 48 | 49 | 我:边界。。。。 50 | 51 | 52 | 53 | 出来问面试官他们是做什么方向的,说是开发~ 感觉岗位投的不对口。。 54 | 55 | 56 | 57 | 然后让我走了。。。。 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | -------------------------------------------------------------------------------- /互联网/暑期实习/微软-lk: -------------------------------------------------------------------------------- 1 | 一面 2 | 面试官:介绍一下简历中的项目 3 | 我:介绍了其中一个,然后被面试官疯狂怼,比如:为什么不用Bert、transformer这种,反正项目被怼的怀疑人生(大概20多分钟)。 4 | 面试官:手写一下lstm的结构吧,分析下lstm为什么会导致梯度消失,你觉得lstm哪一个门比较重要 5 | 我:勉强写出来了 6 | 面试官:做一道算法题,找出有序数组中比给定目标值小的最大的数 7 | 我:写完了。 8 | 面试官:又做了一个算法题,有点记不清了(反正不难) 9 | 10 | 二面: 11 | 面试官:介绍简历中的项目 12 | 我:依旧被怼(又过了20分钟。。。) 13 | 面试官:来做道算法题,给定一个二维数组,中间有障碍物,随机给你一个起始位置,给出从起始位置走出边界的最短步数 14 | 我:写好了 15 | 面试官:大体上没什么问题 16 | 17 | 中间还问了一些东西基本围绕简历问,有点记不清了。我记得二面没问机器学习相关的东西 18 | 19 | 三面: 20 | 面试官:介绍一下你的实习项目 21 | 我:吧啦吧啦吧啦 22 | 面试官:给我展示了他们的小娜语音助手,如果你要做一个语音聊天助手,你会从哪些角度考虑 23 | 我:吧啦吧啦,乱说一通 24 | 面试官:数据量特别大的时候怎么办 25 | 我:根据人物特性进行分类存储 26 | 面试官:来做个算法题,k个有序链表中找出前k小的数 27 | 我:建一个堆大小为k,吧啦吧啦。 28 | 面试官:那这个时间复杂度是多少 29 | 我:nlog(k)(我记得我答的是这个,有点记不清了)。 30 | 面试官:行,那你写代码吧。你用什么语言写? C++? 31 | 我:python行么?C++不太熟悉了。 32 | 面试官:你实习的时候不是用过c++么,用c++写吧 33 | 我:勉强用c++写好了 34 | 面试官:你这c++不熟悉啊,挑了一些语言上的毛病。 35 | 我:嗯,太久不用了。 36 | 面试官:你有什么要问我的么? 37 | 我:方便告诉我今天的面试结果么? 38 | 面试官:我这边没什么问题,应该会给你offer,你等hr通知吧。 39 | 40 | 已收offer 41 | -------------------------------------------------------------------------------- /互联网/暑期实习/微软-sjq.md: -------------------------------------------------------------------------------- 1 | 第一面 2 | 30多岁商务稳重型女面试官 3 | 1.手写中序遍历递归版和非递归版,写完之后发现没考虑各种异常输入..让我写几个测试例子,遂发现问题,改。 4 | 2.面试官凭空臆想了一个字符串模式匹配和替换的应用场景,有些细节忘了,大概是这样:#号代表一个模式串的开始符,给一段包含若干模式串的文本、模式串在文本中的开始、结束下标(这个下标是用户标的,可能是错的..我不懂为什么这么设定)、模式串和对应的替换字符串的数据库表,要求返回替换字符串之后的文本和其中替换字符串的开始、结束下标,手写代码。我写完之后时间不多了,大概讲了一下思路,面试官说她回去再看看代码... 5 | 6 | 第二面 7 | 20多岁温柔软萌型女面试官 8 | 1.问了一些计算机网络相关问题..只记得回答上来了浏览器请求网站响应的过程 9 | 2.问研究方向内容,我讲的她也听不懂,就不问了 10 | 3.算法题:给一个数组代表股票不同日期的价格,(1)不限制买卖次数,求最大可能的收益率,用滑动窗口实现,然后手写代码(2)只能买卖一次,用动态规划做,然后手写代码。 11 | 4.软件系统架构问题。要设计一个人机对话系统,应该怎么划分模块,定义类,类之间什么关系,怎么关联,用代码写出来。有些懵,强行写了几个类,说我也不了解这些,面试官:哈哈你工作了做几个项目就知道了。 12 | 13 | 第三面 14 | 高傲冷酷型男面试官 15 | 1.问项目,我讲了闲聊项目,然后就深度灵魂拷问各种细节,项目也很水,故全程慌张。质问每一个实现环节的不合理之处,质疑怎么能这么实现,数据怎么来的,数据怎么标的,这有必要吗,有大规模测试吗。我的回答抵挡不了面试官的拷问,一度陷入僵局。 16 | 2.项目批判完了,问我有什么优点和缺点...随便扯了一些 17 | 2.给了一个排序相关的算法题,手写快速排序。 18 | 3.自由问答时间 19 | 20 | 不出意外挂了hhh。 21 | 22 | 23 | 24 | -------------------------------------------------------------------------------- /互联网/暑期实习/微软-why.md: -------------------------------------------------------------------------------- 1 | 微软cloud+AI,北京组(投成了开发岗,僵硬) 2 | === 3 | 一面,自我介绍,手撕代码:
4 | 深度拷贝二叉树,递归和非递归写法。递归就用中序遍历,非递归就用BFS+双队列。
5 | 做完题面试官问我对他们组有什么了解,我说我就知道组名。然后面试官就给我说他们主要是做大数据和云计算平台的,以及开发基于云计算平台的各种工具。
6 | 一脸懵逼,原来投错岗了。不过面试官又说他们对背景没啥要求,比如他来之前就不知道大数据是啥。然后又闲聊了几句就结束了一面。 7 | 8 | 二面,自我介绍,手撕代码:
9 | 1.对于给定的字符串数组,找到出现频次最高的K个字符串。
10 | 说了下思路,哈希+最小堆,然后在白板上把代码写完。
11 | 2.稍微修改下规则,对于a和b两个字符串,如果a串的某种排列是b串,那么认为a和b相同。
12 | 在1的基础上做下修改就好了,在哈希之前排序。
13 | 3.对三类数据进行排序,即A类在前,B类在中,C类在后。简化问题描述,可以认为对只有0,1,2三种元素的数组进行排序,排序后的数组为0在前,1在中,2在后。
14 | 这道题应该是考察一种O(n)的算法。参考快排的partition函数,使用三个指针i,j,k进行排序。i=0,j=0,k=n-1。如果a[i]是0,那么交换a[i],a[j],并且i和j均加一;
如果a[i]是2,那么交换a[i]和a[k],k减一,i加一;否则i加一。
15 | 面试官指出算法有bug,并给出了一个测试样例。把上面的算法改为a[i]是2时,交换a[i]和a[k],k减一之后,通过了这个测试样例。
16 | 二面结束。 17 | 18 | 三面,自我介绍,手撕代码:
19 | 二叉树的序列化和反序列化。
20 | 序列化:BFS,定义间隔字符为'。
21 | 反序列化:先根据间隔字符分割字符串,然后逆向BFS建二叉树。
22 | 最开始写的代码有bug,改了半天改好了,三面就结束了。 23 | 24 | 回来等通知。 25 | -------------------------------------------------------------------------------- /互联网/暑期实习/微软面经-dy.md: -------------------------------------------------------------------------------- 1 | 一面: 2 | 先自我介绍一下 3 | 1字符串中的最长回文子串问题 4 | 我答了动态规划的解法, 5 | 面试官:你能不能想出O(n)的解法 6 | 我:想了一会儿放弃了 7 | 面试官:Manacher法了解吗 8 | 我:不了解 9 | 2 找出大数据中最大的n个数 10 | 答:法1:分成多个小文件,维护一个节点数为n的最小堆,分别读小文件更新最小堆。 11 | 法2: 分成m个小文件,每个小文件读入内存后快排取top n,合并m个top n。 12 | 面试官:手写一下堆排序: 13 | 我:只写了用java库priorityQueue实现的方式 14 | 面试官: 不用库写一下 15 | 我:没写出来 16 | 3 有若干个酒店,给定每个酒店到顾客的距离以及价格,要求返回价格最低的n个酒店,且返回的每个酒店都是同价位下距离最近的。 17 | 我:维护一个酒店数组,每个元素的下标表示价格,值为一个酒店对象,存储当前价格下距离最近的酒店。便利酒店集合,若当前价格已存在,则更新为这两个酒店中距离最短的一个。 18 | 最后顺序便利酒店数组,依次输出不为空的n个酒店。 19 | 20 | 后面跟小哥扯了扯蛋,一面勉强过的。他说你这个还行吧,但准备的不是很充分啊,得好好准备的,虽然不是最好的,但还是给你过了吧,给你个机会。 21 | 22 | 二面: 23 | 自我介绍 24 | 1给定n个字符串,计算出出现次数最多的字符串,n很大 25 | 我:首先想到的肯定是hash表,但空间复杂度太高,我再想想 26 | 我: 用Trie 树可以 27 | 面试官:那你用Trie树把这道题的完整代码写一下 28 | 我:手撕成功 29 | 面试官:如果是出现次数最多的前n个字符串呢? 30 | 我:建立Trie树的同时维护一个最小堆 31 | 面试官:假设你现在是黑客,写一些测试用例来攻击你的代码 32 | 我:我的代码中子树是用数组实现的,默认大小26,只能处理小写字母的单词,若有大写字母则会出错,为了解决这个问题,可以将Trie树的子树数组扩大为255,以ASCII码为key。 33 | 面试官:嗯,还有呢,继续 34 | 我:还有可能出现中文字符,这样就需要改变子树的实现方式,不用数组而是使用HashMap来实现。 35 | 面试官:继续,再想 36 | 我:还有可能出现当前码表之外的字符,比如我用的gbk编码,但是出现了日文等,解决方法可以使用别的码表如utf-8 37 | 面试官:继续,你还能怎么搞崩这个程序 38 | 我:输入一个巨大的字符串,撑爆内存 39 | 面试官:正常情况下有可能出错吗? 40 | 我:代码是线程不安全的,多线程可能出错,可以用volatile修饰 41 | 42 | 二面感觉答的贼好,只用了不到40分钟 43 | 44 | 三面: 45 | 自我介绍 46 | 讲一个你做过最难的任务 47 | 1 一颗二叉树中有一个叶子节点,它有一个指针错误地指向了树中的一个其他节点,如何找到这个节点并删除这个错误的指针? 48 | 我:用hashSet加先序遍历,如果下一个节点已经访问过则找出,删除指向该节点的指针(不完全) 49 | 然后面试官指出来一个缺陷,上述算法可能会删除非叶节点的那个指针,然后引导一番,让我改进并写出完整代码 50 | 我:写出来了,应该是过了 51 | 2 两个长度为n 的数组 ,找出两个数组中第n小的数 (LeetCode原题) 52 | 我 用二分法答出,应该也算过了 53 | 54 | 三面稍微卡了些,不过在面试官的引导下还是勉强做出来了 55 | 56 | offer已收 57 | -------------------------------------------------------------------------------- /互联网/暑期实习/快手-lk: -------------------------------------------------------------------------------- 1 | 一面 2 | 面试官:介绍一下简历中的项目 3 | 面试官:算法题:讲一个排序二叉树转换成排序链表,原地置换 4 | 面试官:一道智力题,一根绳子切成三段,这三段能组成一个三角形的概率 5 | 面试官:训练深度神经网络时,有什么调参技巧 6 | 7 | 二面: 8 | 面试官:介绍简历中的项目 9 | 面试官:算法题:k个有序链表排序,用python手写堆排序 10 | 面试官:手写tensorflow中dropout实现原理,给定一个tensor 11 | 面试官:batch normalization原理,优点 12 | 面试官:lstm原理,为什么解决梯度消失 13 | 面试官:神经网络中用lstm,如果网络不拟合,怎么调整 14 | 15 | 感觉凉凉。。。。 16 | -------------------------------------------------------------------------------- /互联网/暑期实习/滴滴数据分析凉经-wn.md: -------------------------------------------------------------------------------- 1 | ## 1 面试岗位:滴滴反欺诈数据分析 2 | 3 | ## 2 面试内容 4 | 5 | ### 2.1 一面 6 | 面试官:一个略青涩的小伙砸 7 | 8 | 让自我介绍,听到我介绍之前的项目时,他开始讲述他自己(项目)的故事…… 9 | 10 | 然后接着介绍我的项目经历; 11 | 12 | 问到了一些数据预处理的方法,主要从统计角度回答的 13 | 14 | 他又开始讲述自己(项目)的故事…… 15 | 16 | 最后问问题我问了两个,感觉间接导致了二面面试官的暴走(当然,不是根本原因 17 | - 几点下班 18 | - 面试有几面 19 | 20 | ### 2.2 二面 21 | 22 | 面试官:一个满脸倦容的姐姐 23 | 24 | 面试官一上来就问了以下灵魂问题: 25 | - 几月份能来,能实习几个月 26 | - 对996怎么看 27 | - 如果不能转正,是不是秋招/有offer的时候就走了 28 | - 如果短时间给你很多做不完的任务,你要怎么handle 29 | - …… 30 | 31 | 我感到满腔的热情被劝退,激情回怼 32 | 33 | 后来出了一个sql应用题,有两问,第一问做出来了;第二问比较难一时半会没思路,面试官看到我在吭哧吭哧写第二问没给时间写 34 | 35 | 整个过程对我这个人没啥兴趣,让回去等通知 36 | 37 | ## 3 感想 38 | 39 | 1. 面试官对自己做的事情不感兴趣; 40 | 2. 面试官没有hc且不想招人; 41 | 3. 面试官过得很疲惫; 42 | 4. 面试环境无纸,做题写代码都是在我的简历背面写的【官方劝退 -------------------------------------------------------------------------------- /互联网/暑期实习/腾讯-lk: -------------------------------------------------------------------------------- 1 | 腾讯视频: 2 | 一面: 3 | 面试官:介绍一下你的实习经历 4 | 我:吧啦吧啦 5 | 面试官:挑了一个项目,你详细介绍一下吧 6 | 我:吧啦吧啦 7 | 面试官:来咱们做道算法题,股票买卖那个(leetcode原题) 8 | 我:写好了 9 | 面试官:再做一道算法题吧,记不清了也是个动态规划题,不难 10 | 我:写好了 11 | 面试官:过拟合发生的原因是什么,有什么好的解决手段? 12 | 我:数据量少且模型复杂,简单说了下原因 13 | 面试官:你等会吧,二面面试官有点事儿一会来,开启闲聊模式。。。。 14 | 15 | 二面: 16 | 面试官:介绍你其中一段实习经历 17 | 我:balbala 18 | 面试官:你了解机器学习么? 19 | 我:了解一些 20 | 面试官:svm和lr之间的区别和联系?什么情况下用lr比较好 21 | 我:吧啦吧啦 22 | 面试官:dropout你知道吧? 23 | 我:嗯,简单了解过 24 | 面试官:你知道tensorflow里面dropout实现的原理么? 25 | 我:当时说错了 26 | 面试官:介绍一下batch noramlization 27 | 我:吧啦吧啦 28 | 面试官:写个代码吧,将一个有序数组按照绝对值的大小排序 29 | 我:写好了 30 | 31 | 二面结束了2天吧,接到了腾讯视频那边的电话,说是之前nlp组里名额不够了,被面试官推荐到推荐那边 32 | 33 | 三面: 34 | 面试官:你觉得前面面试的表现咋样? 35 | 我:还行吧,感觉不是很满意 36 | 面试官:前面两个面试官对你评价都不错,他们推荐你来我这边。二分类:一层神经网络,激活函数为sigmoid,误差函数为交叉熵。你写下反向求导吧 37 | 我:写了一会写好了 38 | 面试官:你用过什么深度学习工具? 39 | 我:tensorflow 40 | 面试官:你说一下神经网络调参的经验吧 41 | 我:吧啦吧啦吧 42 | 面试官:介绍了一下他们这边做的事情。 43 | 44 | 腾讯视频offer已收 45 | 46 | 腾讯微信 47 | 一面: 48 | 面试官:给我一张纸,上面三道算法题(都是leetcode的原题),让我自己在那写了半个小时吧。 49 | 我:写好了,您看下。 50 | 面试官:你用python啊,其中有一道题调用了python的自带库函数,他一直质疑我那道题是否正确。 51 | 我:解释了一下那个思路 52 | 面试官:另一道题,你这道题这么解也对,但是有更好的解法 53 | 我:想了一会,面试官提示了我一下,我也没明白。。。。 54 | 二面: 55 | 面试官:介绍一下你的项目吧 56 | 我:吧啦吧啦介绍 57 | 面试官:来写一道算法题,给你一个能够生成随机数的函数,生成数的范围为:0-6000,你怎么生成0-25000的随机数? 58 | 我:切分的思想,吧啦吧啦介绍了一下 59 | 面试官:如果一个神经网络激活函数是cos,你怎么反向求导 60 | 我:现在也没明白他是啥意思。。。 61 | 面试官:l1和l2正则化你介绍一下 62 | 我:简单介绍了一下,说明了一下他们的区别 63 | 64 | 三面: 65 | 面试官:介绍一下你的项目 66 | 我:介绍了一个(然后被怼,他觉得这样做不合理。。。。) 67 | 面试官:反正全程围绕着如何设计一个推荐系统,推荐系统中遇到的各种问题如何处理 68 | 我:胡乱的说,实在不了解推荐系统,感觉面试官很不满意。。。 69 | 70 | 腾讯微信果然挂掉了。。。。 71 | 72 | 73 | -------------------------------------------------------------------------------- /互联网/暑期实习/苹果-dn.md: -------------------------------------------------------------------------------- 1 | 一 电话面 2 | 3 | 1.问项目 4 | 5 | 2.问对话整体框架 6 | 7 | 3.算法题 "."代表任意字符 "*"代表任意多个字符,给定字符串(比如ab)和匹配规则(比如a.), 返回两者是否能匹配上 8 | 9 | 10 | 11 | 二 现场面: 12 | 13 | 一轮 14 | 15 | 1.问项目 细节 以及 现在的话 怎么改进 & 详细问了一个我说的新的论文 16 | 17 | 2.算法题:最大回文子串 18 | 19 | 二轮 20 | 21 | 1.项目细节(项目是用xgb做的) & xgboost及相关的学习器说一下 xgboost究竟为什么快 22 | 23 | 2.讲seq2seq加attention细节 对各激活函数的理解 24 | 25 | 3.算法题:给定一个字符串集合S(比如{abc, ef})再给定一个字符串(比如abcef) 如果存在一种字符串的切分方式 使切分后的子串在S中都有出现过 就返回True 反之False 26 | 27 | 三轮 28 | 29 | 1.各种随便聊,说是想看看我都做了什么。。。:提到加班 勤奋是好事; 30 | 31 | 2.算法题:避免整体排序 求一个数组里的中位数 32 | 33 | 34 | 35 | 没有过。。。 -------------------------------------------------------------------------------- /互联网/暑期实习/阿里小蜜-sjq.md: -------------------------------------------------------------------------------- 1 | 第一轮电话面 2 | 1.自我介绍 3 | 2.让我讲一个项目,就讲了一个最近的项目,问的不深。 4 | 3.然后对我的研究方向比较感兴趣,或者说不解。我费很大功夫给他讲明白我做的是什么(表述能力很重要...) 5 | 4.最后问了个leetcode第一题:Two Sum...我说了用哈希表实现的方案,面试官问怎么不用额外空间同时时间复杂度也不是n平方。我短暂想了一下回答说想不出来hhh,然后在线编程实现哈希表的代码。 6 | 7 | 第二轮现场面 8 | 1.自我介绍 9 | 2.问逻辑回归极大似然函数怎么推导,参数如何更新。有些懵,在面试官的步步诱导下还是写了出来 10 | 3.问逻辑回归和svm有什么异同,不同点我好像说了两个(1)逻辑回归不能处理线性可分问题,svm可以。(2)svm参数更新只与超平面附近的点有关,lr参数更新涉及到所有点,复杂度更高。我应该是没回答到点上,然后面试官说什么我忘啦... 11 | 4.讲svm原理,不涉及公式推导 12 | 5.简历里面写了用过DBCSAN,BIRCH聚类。面试官问DBCSAN什么原理,怎么计算的。我说只了解它是基于密度的聚类,适用于小规模数据,怎么算的不了解... 13 | 6.算法题:用o(n)复杂度判断链表是否存在环,想了一会儿让面试官提示了一下...然后手写代码 14 | 最后问答时间,我问 你们周末双休吗 答 我们部门双休 15 | 16 | 然后就挂了hhh 17 | 18 | -------------------------------------------------------------------------------- /互联网/暑期实习/阿里小蜜-why.md: -------------------------------------------------------------------------------- 1 | 阿里巴巴-阿里小蜜-面经 2 | === 3 | *** 4 | date: 3.26 5 | *** 6 | ###一轮: 7 | 8 | 自我介绍一下,然后面试官问了下得过什么奖,然后就开始介绍项目。 9 | 10 | 把简历上面写的项目简要的介绍了一遍,然后面试官开始问问题。 11 | 12 | >做过的这些项目,有没有完整的做过一个对话系统,可以重点介绍一下。 13 | 14 | Me: 因为我主要是做DM的,所以NLU和NLG部分没有参与。 15 | 16 | >(皱眉)我看你电信的这个项目写的比较多,再介绍一下这个项目里你主要的工作吧 17 | 18 | Me: 介绍了一下怎么指导电信那边做DM的,主要是基于MDP建模的Q-learing和基于有限状态自动机的方法;以及给电信那边做的闲聊系统。 19 | 20 | >能详细说一下怎么用Q-Learing做对话管理吗? 21 | 22 | Me: 在纸上写了下公式,然后分析了下MDP和多轮对话的关系 23 | 24 | >那你有没有实现过一个DQN? 25 | 26 | Me: 回答用OpenAI GYM做过简单的model,但是没有在对话中用过DQN,主要是用PG的方法和AC、A3C做对话管理。 27 | 28 | >那你说一下怎么用的PG 29 | 30 | Me: 写了下REINFORCE的公式,然后讲了一下各个变量的意义 31 | 32 | >(面试官打断,说这个和actor-critic有什么不同,为什么要用ac?) 33 | 34 | Me: 写了下ac的公式,说了下REINFORCE要用蒙塔卡罗搜索模拟整轮对话,容易出现大的偏差,而actor-critic就不需要,借助于值函数可以避免这个问题。 35 | 36 | >再讲一下你电信做的东西吧 37 | 38 | Me: 讲了下闲聊怎么做的,画了下系统框架图,分析了下为什么不用seq2seq而用基于规则的方法,面试官还让举了个例子。 39 | 40 | >写下代码吧,开始问算法,不过都挺简单的,四个算法。 41 | 42 | >在纸上写下二分搜索 43 | 44 | Me: (确认了下只需要写函数就行了)用C++写了下二分搜索 45 | 46 | >两数之和问题、三数之和问题(leetcode原题) 47 | 48 | Me: 说了下思路,第一个哈希可以$O(N)$,第二个排序加双指针可以$O(N^2)$ 49 | 50 | >输出一个数组所有的逆序对(这里不知道是不是面试官故意设置的陷阱) 51 | 52 | Me: 一开始没发现问题,说可以用归并,然后开始写代码,写了一半发现如果要输出所有的逆序对,那不管什么方法都会退化为$O(n^2)$的时间复杂度。遂和面试官沟通。 53 | 54 | >那你就输出逆序对的个数吧 55 | 56 | Me: 简单的归并,略微修改一下merge函数就行了,不过时间不多了,面试官只让我写完merge,给他讲一下什么思路就行了。 57 | 58 | >然后又问了下我对Bert怎么看 59 | 60 | Me: 没看过论文,不过我知道是预训练模型 61 | 62 | >那你知道怎么用吗? 63 | 64 | Me: 应该是训练好的底层网络直接加到自己的模型里用就行了 65 | 66 | >知道Bert怎么来的吗? 67 | 68 | Me: 是Transformer来的 69 | 70 | >两者有什么区别? 71 | 72 | Me: 没看过论文,没法回答这个问题。 73 | 74 | >又问了下对强化学习的探索和利用的关系怎么看 75 | 76 | Me:说了下自己之前做的的相关实验,不过都失败了 77 | 78 | >还有什么要问我的吗? 79 | 80 | Me:阿里这边怎么评估一个对话?还是成功率吗? 81 | 82 | >基本上就是通用的那一套评估方式。 83 | 84 | ####至此一轮结束 85 | 86 | ####等了20分钟 87 | 88 | ###二轮: 89 | 90 | 自我介绍 91 | 92 | >问了下家乡、本科专业(我本科通信工程)
93 | >从宏观框架上问了下对话系统,然后主要问对话管理可以怎么做,各有什么优缺点
94 | >介绍一下现在用的对话系统的模型,网络结构,怎么来的,和参考的论文有什么区别 95 | 96 | Me: 把上面的问题回答了一遍 97 | 98 | >又问了一下我写的关于REINFORCE和AC方法的公式的差异性,以及估计策略函数的$\theta$的物理意义 99 | 100 | Me:还是之前回答一面的那一套,$\theta$就相当于神经网络的参数 101 | 102 | >(这时候时间超了,别人要用会议室)简单又聊了几句就结束了二面,让我回去等电话面试 103 | 104 | ####二轮结束 105 | 106 | *** 107 | 4.9 update 108 | *** 109 | 110 | ###交叉面(三面) 111 | 面试官先让介绍自己做的工作,照着简历介绍了一下。 112 | 113 | 说到用SVM做分类器的时候,面试官打断了一下,问我用了什么核函数。回答用了高斯核函数,面试官又问有没有用线性核函数?
114 | 回答用了,并且发现线性核函数稍微要比高斯核函数效果好一点,但是并不明显。 115 | 116 | 然后接着问我在做这个分类器的时候有没有遇到什么问题?回答说训练时间太久了。然后追问我原因,我说应该是低维到高维那里计算耗时比较久。接着追问我高斯核函数映射到无穷维时,计算机怎么表示呢?(其实这里算是下一个问题的提示了,结果我没反应过来)接着追问我核函数的作用,为什么要用核函数?我回答的是因为要处理线性不可分的问题时,需要从低维映射到高维。面试官给我说回答错了,然我回去再看看书。(心里拔凉拔凉的,后来查了下资料,核函数应该是用来把高维空间的计算转化到低维空间的) 117 | 118 | 然后又让我介绍了一下做的对话系统,具体有哪些工作?如何用强化学习实现一个对话管理模块。然后又问了关于AC相关方法,以及我是怎么实现A3C算法的,如何验证算法的正确性。 119 | 120 | 最后又问我既然可以用有限状态自动机,为什么还要用强化学习来做对话系统呢?回答因为有限状态自动机是硬编码,要处理异常状态只能通过手动编码实现。但是强化学习模型可以通过学习,实现处理这种异常状态的能力,更加灵活。 121 | 122 | 然后三面结束(面试持续了大概不到30分钟) 123 | 124 | *** 125 | 4.18 update 126 | *** 127 | 128 | ###HR面 129 | 130 | 1.简要介绍学习经历
131 | 2.对自己的评价
132 | 3.最近在学什么东西
133 | 4.对工作的地点怎么看?哪里人? 134 | 135 | *** 136 | 4.29 update 137 | *** 138 | 139 | ###第五面(加面-交叉面) 140 | 先自我介绍,然后把中国电信的项目讲了下。 141 | >你的研究方向是什么?具体有什么工作? 142 | >研究领域都有哪些方法?和你做的有什么区别? 143 | >有没有实习过?实验室关于暑假实习怎么看? 144 | -------------------------------------------------------------------------------- /互联网/秋招/tecent_feifei: -------------------------------------------------------------------------------- 1 | 1. 介绍论文(持续挺久) 2 | 问:你说ODA比self-att好,我不觉得容纳能力强了,性能就一定好。你也没有在文本任务上尝试。 3 | 我:我确实没有实验,所以没办法反驳你。 4 | 问:不要非常肯定的说自己的比别人的好,做研究要有包容的心态 5 | 我心想,有道理。 6 | 问:你现在第二名是ensemble的结果,第一名别人没有写ensemble 7 | 答:CVPR 2019已经开了,他是ensemble的。 8 | 9 | 2. n个数排序(n非常大无法载入内存) 10 | 我:可以使用python的hdf5存储n个数,在程序中和数组一样,使用快排归并堆排随便挑一个。 11 | 问:你这是作弊。不许使用pyhon库。 12 | 问:你知道linux的sort函数吗 13 | 我:不知道 14 | 问:你会linux吗 15 | 我:会 16 | 问:linux的sort函数就要考虑这个问题 17 | 问:你再想想 18 | 我: 设内存只能存放m个数,将n个数切分为k=n/m部分,每个部分载入内存排序,再合并这k个部分。 19 | 问:如何合并这k个部分 20 | 我:在内存中构建大小为k的堆,存放k个部分的第一个元素。 21 | 问:你的想法有问题 22 | 我:哪里有问题 23 | 问:你再想想 24 | 我:不知道 25 | 问:k也可能放不进内存 26 | 我:思考了一下,如果放不进内存,则将k个部分再进行k'=k/m切分,直到k'<=m为止 27 | 问:嗯 28 | 29 | 3.堆排 30 | 我:写出个大概的循环 31 | 4.写下你的merge过程 32 | 我:写了merge_k_linked_list 33 | 问:很奇怪你为什么用链表 34 | 我:因为方便找到后面一个 35 | 问:链表有什么缺点 36 | 我:链表很好啊,可以找到后面一个元素 37 | 问:链表空间消耗太大了,可以用数组。 38 | 我:哦 39 | 40 | 5.还有什么问题 41 | 我:我面试有什么不足的 42 | 问:代码能力需要加强,另外不要果断的说自己的比别人的好。 43 | 44 | 总结: 45 | 感觉很凉,但是收获挺大的。 46 | 1、之前分析问题太过主观,以后合作学习的时候应该以更多包容的心态。 47 | 2、leetcode还是要多练习。 48 | -------------------------------------------------------------------------------- /国企银行/README.md: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/liuaiting/mianjing/5457364972ebfccf8c2b4c8af7a2c2f5b009d344/国企银行/README.md -------------------------------------------------------------------------------- /暑期实习/2018暑期实习面经.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/liuaiting/mianjing/5457364972ebfccf8c2b4c8af7a2c2f5b009d344/暑期实习/2018暑期实习面经.pdf -------------------------------------------------------------------------------- /暑期实习/360_hml.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/liuaiting/mianjing/5457364972ebfccf8c2b4c8af7a2c2f5b009d344/暑期实习/360_hml.pdf -------------------------------------------------------------------------------- /暑期实习/ali.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/liuaiting/mianjing/5457364972ebfccf8c2b4c8af7a2c2f5b009d344/暑期实习/ali.pdf -------------------------------------------------------------------------------- /暑期实习/tencent_hml_数据平台部.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/liuaiting/mianjing/5457364972ebfccf8c2b4c8af7a2c2f5b009d344/暑期实习/tencent_hml_数据平台部.pdf -------------------------------------------------------------------------------- /暑期实习/【秋招】今日头条_hml.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/liuaiting/mianjing/5457364972ebfccf8c2b4c8af7a2c2f5b009d344/暑期实习/【秋招】今日头条_hml.pdf -------------------------------------------------------------------------------- /暑期实习/【秋招】新浪微博_hml.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/liuaiting/mianjing/5457364972ebfccf8c2b4c8af7a2c2f5b009d344/暑期实习/【秋招】新浪微博_hml.pdf -------------------------------------------------------------------------------- /暑期实习/头条-GGY.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/liuaiting/mianjing/5457364972ebfccf8c2b4c8af7a2c2f5b009d344/暑期实习/头条-GGY.pdf -------------------------------------------------------------------------------- /暑期实习/头条_MQ.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/liuaiting/mianjing/5457364972ebfccf8c2b4c8af7a2c2f5b009d344/暑期实习/头条_MQ.pdf -------------------------------------------------------------------------------- /暑期实习/美团&阿里&腾讯.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/liuaiting/mianjing/5457364972ebfccf8c2b4c8af7a2c2f5b009d344/暑期实习/美团&阿里&腾讯.pdf -------------------------------------------------------------------------------- /暑期实习/美团_DUDU.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/liuaiting/mianjing/5457364972ebfccf8c2b4c8af7a2c2f5b009d344/暑期实习/美团_DUDU.pdf -------------------------------------------------------------------------------- /暑期实习/腾讯&美团&阿里-GGY.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/liuaiting/mianjing/5457364972ebfccf8c2b4c8af7a2c2f5b009d344/暑期实习/腾讯&美团&阿里-GGY.pdf -------------------------------------------------------------------------------- /暑期实习/腾讯阿里面试_yh.pdf: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/liuaiting/mianjing/5457364972ebfccf8c2b4c8af7a2c2f5b009d344/暑期实习/腾讯阿里面试_yh.pdf --------------------------------------------------------------------------------