- 博客(46)
- 收藏
- 关注
原创 【学习笔记】李沐斯坦福21秋季:实用机器学习中文版
自学习,假设我们有一些已经标注好的数据,一在小数据里训练一下模型,二再对没标好的进行预测,称为伪标号,三将两种数据合并,再进行预测,多次循环。判断标号的确信程度选择留下来的标号数据,再进行循环预测,让样本置信程度更高。做法1:半监督学习 基于有标签的小部分数据进行训练 在无标签上测试得到标签 (原始数据+生成标签数据再次训练模型,更新标签)做法3:弱监督学习 根据数据结果人工设置筛选条件去获得一些标签 如包含“xx”关键词的就为黑样本。半监督学习:没标注数据和有标注数据共同使用。分类数据怎么看数据分布。
2025-04-07 21:41:44
202
原创 Transformer、BERT以及GPT系列联系
在GPT中,每个单词的表示都是通过自回归模型计算得到的,这个模型会考虑前面所有的单词,以及它们对应的位置,来预测下一个单词。BERT模型的输入是两个序列,一个序列作为模型的输入,另一个序列作为模型的输出,模型需要判断这两个序列是否相互关联。这个过程被称为下一句预测任务。GPT大模型(全称是Generative Pre-training Transformer)技术是一种使用自回归模型进行语言建模的预训练模型,和Bert一样它也采用了Transformer架构,并使用了大量未标记的文本进行预训练。
2024-10-11 10:37:06
501
原创 YOLO系列模型
首次提出实时目标检测的概念,通过一个神经网络来在一张图像上实现目标定位和分类的任务。将输入图像分割成SXS网格(论文中S=7),每个网格负责检测该区域内中心点落在此网格内的物体。每个网格需要预测出B个bbox、对应的置信度、属于各个类别的概率(一共是C个类别),论文中B=2,此处的置信度是「有object的概率*预测框和真实框的IOU」,如果此处没有object,这个置信度应该为0,并且类别的概率只针对有object的网格进行预测,没有object则不进行预测,主要体现在loss上。
2024-10-07 21:02:09
1105
1
原创 huggingface相关问题
路径:/anaconda/envs/mmt/lib/python3.8/site-packages/huggingface_hub/constants.py。test.2018.fr bpe处理后的文本没找到。huggingface连不上。
2024-07-06 15:27:34
268
原创 ps学习记录
使用油漆桶 选择前景色 按shift+单击 可以替换颜色。快速选择工具大小调节:Alt+鼠标右键,左右拖拽。增加图像选区:按住Shift+划选区。相交选区:Shift+Alt+划选区。填充为背景色:Ctrl+delete。填充为前景色:Alt+delete。删除选区:选中选区Delete。放大缩小图片:Alt+鼠标滚轮。窗口->工作区->复位基本功能。抓手移动图片:空格+鼠标左键。减少选区:按住Atl+划选区。恢复到上一步:Ctrl+Z。复制图层:Ctrl+j。取消选择:Ctrl+D。
2023-04-12 22:07:40
502
原创 【PAT】python 1007 Maximum Subsequence Sum
【PAT】1007 Maximum Subsequence Sum
2022-08-20 21:01:37
276
原创 【天梯】python L2-023 图着色问题 (25 point(s))
from collections import defaultdictv,e,k=map(int,input().split())s=defaultdict(set)for i in range(e): a,b=map(int,input().split()) s[a].add(b) s[b].add(a)n=int(input())c=defaultdict(set)for i in range(n): flag=0 color=list(map(in.
2022-04-23 08:49:12
767
原创 【天梯】python L2-010 排座位 (25 point(s))
from collections import defaultdictn,m,k=map(int,input().split())friend=defaultdict(set)dui=defaultdict(set)for i in range(m): a,b,c=map(int,input().split()) if c==1: friend[a].add(b) friend[b].add(a) else: dui[a].a.
2022-04-22 14:37:35
1236
原创 【天梯】python L2-006 树的遍历 (25 point(s))
树class TreeNode: def __init__(self, val=0, left=None, right=None): self.val = val self.left = left self.right = rightn=int(input())host=list(map(int,input().split()))inorder=list(map(int,input().split()))def buildTree(in
2022-04-21 00:33:52
910
原创 【天梯】python L2-022 重排链表 (25 point(s))
代码先放着有时间再改测试点1和4过不了a,b=map(str,input().split())node={}n=int(b)for i in range(n): c,d,e=map(str,input().split()) node[c]=(d,e)lis=[]n=0while(a!='-1'): lis.append(a) a=node[a][1] n+=1res=[]if n==2: print('%s %s %s'%(lis[1],
2022-04-21 00:22:29
543
原创 【天梯】python L2-021 点赞狂魔 (25 point(s))
这道题看题目看了很久,没太读懂“如果有并列,则输出标签出现次数平均值最小的那个”这句话的意思。代例子想了想发现就是标签出现次数平均值最小就是总次数除以不同的标签个数TT代码如下:n=int(input())nam={}for i in range(n): s=list(map(str,input().split())) nam[s[0]]=(len(set(s[2:])),int(s[1])/len(set(s[2:])))lis=sorted(nam.items(),key=l
2022-04-20 23:38:01
559
原创 【天梯】python L1-025 正整数A+B (15 point(s)) 简洁
看题!看题!看题!最开始测试点5和测试点6过不去仔细看了一遍题发现就算是正整数但超出范围了依然不算加了限制条件后过了a,b=map(str,input().split(' ',1))if a.isdigit() and b.isdigit() and int(a)>=1 and int(b)>=1 and int(a)<=1000 and int(b)<=1000: print("%s + %s = %d"%(a,b,int(a)+int(b)))elif a.
2022-04-20 09:42:49
301
原创 【天梯】python L1-020 帅到没朋友 (20 point(s))
注意:朋友圈只有一个人的算没朋友朋友圈出现其他人的都算有朋友n=int(input())res=[]s={}for i in range(n): lis=list(map(str,input().split())) m=int(lis[0]) if m==1: continue for i in range(m): s[lis[i+1]]=s.get(lis[i+1],0)+1mb=int(input())li=list(map
2022-04-20 09:10:05
542
原创 【天梯】python L2-003 月饼 (25 point(s))
改了好久还是第三个测试点过不去没想明白有大佬知道了可以告诉我嘛我太菜了n,d=map(float,input().split())n=int(n)store=list(map(float,input().split()))sell=list(map(float,input().split()))s={}i=0for k in range(n): if store[i]==0: m=store.pop(i) n=sell.pop(i) .
2022-04-16 10:42:30
752
1
原创 【天梯】python L2-026 小字辈 (25 point(s))
有没有1、2、6的测试数据呀TTfrom collections import defaultdicts= defaultdict(list)n=int(input())x=list(map(int,input().split()))for i,j in enumerate(x): s[str(j)].append(i+1)cn=[0 for i in range(1+n)]k='-1'def bfs(k): if k not in s: return.
2022-04-15 09:20:37
478
原创 【天梯】python L2-031 深入虎穴 (25 point(s))
划重点007 发现不存在两条路通向同一扇门。最后一个超时了 暂时没想到该如何优化 如果有uu会了欢迎指教参考博文n=int(input())pre=[0 for i in range(n+1)]res=[]for i in range(1,1+n): tep=list(map(int,input().split())) if tep[0]==0: res.append(i) continue else: for j i.
2022-04-14 11:11:00
1054
5
原创 【天梯】python L2-001 城市间紧急救援 (25 point(s))
L2-001 城市间紧急救援 (25 point(s))1.最短路径2.最短路径条数3.最大资源
2022-04-13 09:28:00
2020
1
原创 【天梯】 python L2-005 集合相似度 (25 point(s))
这个题目就是求两个集合的并集的不同数字个数和两个集合都有的不同数字个数。def count(a,b): a1=set(a[1:]) b1=set(b[1:]) cn=0 for i in a1: if i in b1: cn+=1 com=[] com.extend(a[1:]) com.extend(b[1:]) co=len(set(com)) return cn/con=int(inp
2022-04-02 23:20:19
905
原创 【天梯】python L2-009 抢红包 (25 point(s))
class human(): def __init__(self,sid,income=0,count=0): self.income=income self.count=count self.sid=sidn=int(input())a=[]for i in range(1+n): a.append(human(i))for p in range(n): s=list(map(int,input().split()))
2022-04-02 23:11:08
1090
原创 【天梯】python L1-019 谁先倒 (15 point(s))
划拳是古老中国酒文化的一个有趣的组成部分。酒桌上两人划拳的方法为:每人口中喊出一个数字,同时用手比划出一个数字。如果谁比划出的数字正好等于两人喊出的数字之和,谁就输了,输家罚一杯酒。两人同赢或两人同输则继续下一轮,直到唯一的赢家出现。下面给出甲、乙两人的酒量(最多能喝多少杯不倒)和划拳记录,请你判断两个人谁先倒。注意条件:1、两人同赢或两人同输则继续下一轮,直到唯一的赢家出现。=》 只有一人赢 才算2、先判断再输入x,y=map(int,input().split())n=int(input()
2022-04-01 19:18:09
1062
原创 【天梯】python L2-002 链表去重 (25 point(s))
pre,n=map(str,input().split())node={}num=[]keep=[]dell=[]n=int(n)for i in range(n): s=list(map(str,input().split())) node[s[0]]=(s[1],s[2])while(pre!='-1'): a=abs(int(node[pre][0])) if a not in num: num.append(a) keep
2022-03-31 16:24:22
1221
3
原创 【天梯】L1-078 吉老师的回归 (15 point(s))
错误代码:没有考虑到跳过的题不是连续的,所以不能直接用下标相减。n,m=map(int,input().split())s=[]ea=0for i in range(n): s.append(input()) if "qiandao" in s[i] or "easy" in s[i]: ea+=1if(m+ea>=n): print("Wo AK le")else: print(s[m+ea-1])正确代码:把需要做的题目全部找出
2022-03-31 10:49:42
540
原创 【天梯】L1-009 N个数求和 (20 point(s))
这道题做了挺久,仔细检查后才发现是自己代码表达不清楚,没有把自己的想法写下来。错误: 我是要把前n个通分后与第n个通分记录此时的分子和分母,但是我写的时候每次通分都是除以它对应的分母,但其实应该是除以此时的最小公倍数。于是就转换思路用数组存储了。也算是用动态规划的思想(?)import mathn=int(input())num=list(map(int,input().replace('/',' ').split()))res=[0]*nres[0]=num[0]gcd=[0]*ngcd
2022-03-31 09:05:35
247
原创 【PAT】1008 数组元素循环右移问题 (20 point(s))
思路:不移动数组元素位置,改变输出先后顺序。因为最后一个输出后面无空格,所以分为三种情况讨论,分开确定最后一个元素。1.移动后不变2.只往右移动一个位置3.移动很多,分为前后两部分n,m=map(int,input().split())lis=list(map(int,input().split()))res=[(i+m)%n for i in range(n)]ind=res.index(0)print(ind)if ind==0: for i in lis[ind:-1]:
2022-03-24 18:53:22
301
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人