QIFAN

成长是最神奇的风景

CMU 11642 Search Engine 基于 Feature 的结果获取

LeToR

Feature-based 方法介绍之前的 Boolean , BM25 ,Indri 都是直接根据公式计算排名,到了 expansion query 有了一点学习的意味。Learning to Rank 就是结合多个种类的依据(evidence)来进行模型学习。把学习中的任何一种依据都看成是一..


LeetCode 493 - Reverse Pairs

原题链接: 493. Reverse Pairs 题干给定一个数组 nums ,reverse pair 的定义是数组中的对于两个位置(i, j) ,i < j 且 nums[i] > nums[j] * 2 ,返回 nums 中 reverse pair 的数量 思路受 tag ..


Shape | Sharp | 傻

2017 年第十一周

匆匆忙忙又过去了两周。可以说是冰与火的两个星期,前面是期中,后面是春假。如果单从成绩来说,我这个上半学期过得十分的糟糕。我自己也想不明白遗漏在了哪里,知识真的没有很好的掌握倒是真的,考试时候死背上的公式全部混淆了,该粗心的地方都粗心了。确实似乎是陷入了一个“自以为理解了但并不是这样”的错觉。我大..


LeetCode 44 - Wildcard Matching

原题链接: 44. Wildcard Matching 题干实现支持 ? 与 * 的正则匹配。给定一对字符串,返回是否匹配。'?' 代表匹配一个任意字符'*' 代表匹配任意字符串,包括空字符串isMatch("aa","a&..


CMU 11642 Search Engine - 文件表示

如何表示信息载体:Controlled vocabulary已经有规范格式的文本,某些专业领略流行。 优点:每个 term 都意义明确,而且等级的感觉让类似含义的词语放在一起,支持浏览与搜索缺点:细节少,对文本的覆盖率低,不适合做测试集;建造成本高也不好维护;文件的添加麻烦;搜索比较麻烦 Fre..


CMU 11642 Search Engine - 评估

如何评估文件的相关性

Cranfield Methodology步骤: 获取一系列文本文件(documents) 获取一些信息需求(information needs) 获取相关结果集 用多种角度(人为)评判这些方法获取的结果集相关性 比较各个方法的效果和表现。 1. 获取文本文件(测试集)这些文本文件应该满足无..


LeetCode 65 - Valid Number

原题链接: 65. Valid Number 题干给定一个字符串,如果是一个数字,返回 true ,否则返回 false 思路这题考察的是在题意“数字”定义比较模糊的情况下做题。所以先想几个 corner case 。 “ 0 “ true 开头结尾可以有空格“1. 3” false 中间不能..


LeetCode 151 - Reverse Words in a String

原题链接: 151. Reverse Words in a String 题干给定一个包含单词的字符串,返回单词倒序的字符串。单词中不含空格,输出中可能有连续空格,但输出中单词间以一个空格相连。例子输入: “this is fun”输出: “fun is this” 思路很粗暴的思路就是把字符..


Cabin Down Below

2017 年第九周

最近几周用的标题都是一首喜欢的歌,反正周记也没什么主题。 上一周更加平淡了,找工作没有任何的进展,而且由于写作业而疏于刷题,思路又差点倒回了几个月前,业精于勤荒于嬉。Capstone 的范围终于差不多定下来了,半个学期也过去了。513 的学习给我一种上正轨的愉悦感,但在这门课上没有上进心,只求掌..


LeetCode 2 - Add Two Numbers

原题链接: 2. Add Two Numbers 题干给两个非空的 Linked List ,分别代表倒序的非负整数,比如 3-->2-->1 代表 123 。同样用 LinkedList 形式返回这两个数字的和。 思路从前往后分别代表个十百,所以就按照正常的加法运算,和 = A ..