当前位置: 首页 > news >正文

现在还有做网站的必要吗电商网站设计模板

现在还有做网站的必要吗,电商网站设计模板,教师做网站赚钱,青岛天河小学网站建设赛题描述:根据提供的脱敏资讯新闻数据,选手需要对提供的训练集进行特征工程,构建资讯分类模型,对与测试集进行准确的新闻分类。 最终得分:0.8120。十二点关榜没看到排名,估算100? 训练集很小&am…

赛题描述:根据提供的脱敏资讯新闻数据,选手需要对提供的训练集进行特征工程,构建资讯分类模型,对与测试集进行准确的新闻分类。
最终得分:0.8120。十二点关榜没看到排名,估算100+?
训练集很小,只有八千条数据,痛苦了三天,调参加模型效果不升反降。

训练集只有三列:新闻ID,文字,标签,一共四类标签。
标签分布
根据文本列中的数字个数加入了文本长度特征,能够反映出文本的复杂性或信息量。

X_train['length'] = X_train['文本'].apply(lambda x: len(str(x).split()))
X_test['length'] = X_test['文本'].apply(lambda x: len(str(x).split()))

文本列使用TfidfVectorizer:将文本数据转换为 TF-IDF 特征。
length列使用StandardScaler:将其转换为均值为 0,标准差为 1 的数值范围。

preprocessor = ColumnTransformer(transformers=[('text_tfidf', TfidfVectorizer(), '文本'),('length_scaler', StandardScaler(), ['length'])],remainder='passthrough'
)

选择线性支持向量机作为分类器:

classifier = LinearSVC(class_weight='balanced', random_state=42, dual=False)

使用 GridSearchCV 来进行超参数调优。

param_grid = {'preprocessor__text_tfidf__ngram_range': [(1, 2)],'preprocessor__text_tfidf__max_features': [50000, 70000, 90000],'preprocessor__text_tfidf__min_df': [1, 2, 3],'preprocessor__text_tfidf__max_df': [0.85, 0.9, 0.95],'classifier__C': [0.5, 1.0, 2.0, 5.0, 8.0, 10.0],
}

ngram_range: 设置为 (1, 2),表示我们使用 1-gram 和 2-gram(单词和双词组合)来表示文本特征。

max_features: 控制 TfidfVectorizer 中考虑的最大特征数量。尝试不同的值可以帮助我们找到最佳的特征数量。

min_df 和 max_df: 这些参数控制了 TfidfVectorizer 在选择特征时的文档频率范围,有助于排除低频和高频的噪声词汇。

C: 正则化参数,控制模型的复杂度和对训练数据的拟合程度。

对模型进行了多次交叉验证,以选择最佳参数组合。

grid_search = GridSearchCV(pipeline, param_grid, cv=cv_strategy,scoring='f1_macro',n_jobs=-1,verbose=2)
best_model = grid_search.best_estimator_
predictions = best_model.predict(X_test)

小白第一次参加类似比赛,大佬轻喷。

http://www.cadmedia.cn/news/14030.html

相关文章:

  • 手机网站设计教育类模板网上做广告推广
  • 推广网站有哪些比较好网站seo诊断报告怎么写
  • 品牌网站建设浩森宇特网站内部链接优化方法
  • 山东网站建设公司哪家专业重庆seo公司
  • 安徽海鹏建设工程有限公司网站建站seo推广
  • 广州市门户网站建设硬件工程师培训机构哪家好
  • 网站建设设计文档模板下载html简单网页代码
  • 广州美霖室内设计学校潍坊seo网络推广
  • 北京中交建设公司网站市场营销教材电子版
  • 厦门外贸网站建设报价seo描述是什么
  • 陈江做网站关键词优化百家号
  • 成都百度推广电话号码windows优化大师官网
  • 北京城建道桥建设有限公司网站网站建设制作模板
  • 上海企业网站优化市场营销方案范文
  • 广东网站备案查询今日头条新闻大事
  • 蓬莱建设局规划处网站怎样在百度上免费做广告
  • 张家港设计网站创建网址快捷方式
  • 学校网站建设经验介绍网络优化工程师工资
  • 哪家网站建设好百度信息流广告平台
  • 镇江住房和城乡建设局网站网络推广文案
  • 网站建设分为那几个模块关键词首页排名代发
  • 动易视频网站管理系统如何做好线上推广
  • 沧州网络推广seo网站推广有哪些
  • 怎么做招聘网站的数据分析百度快速排名平台
  • 公司网站建设费如何出账网站推广的10种方法
  • 王爷站住重生嫡女要强嫁免费阅读百度一下你就知道官方
  • 鄂州网吧暂停营业苏州关键词seo排名
  • 网站个性化网站推广联盟
  • 网站关键词排名优化客服石家庄最新消息
  • 政府网站建设的讲话武汉大学人民医院官网