帮助改进数据科学工作流程的 7 个 GPT - KDnuggets

帮助改进数据科学工作流程的 7 个 GPT – KDnuggets

源节点: 2513417

帮助改进数据科学工作流程的 7 个 GPT
图片由编辑
 

ChatGPT 已成为改变世界运作方式的 OpenAI 产品。这里的许多读者已经在使用它们或者至少正在测试它们。就它对我们的帮助而言,我认为我们不能回到原来的工作方式。

OpenAI 提供的创新之一是 GPT 商店,人们可以在其中开发自己的自定义 GPT 模型并与公众分享。超过 3 万个来自构建者的 ChatGPT 自定义 GPT 已开放。事实上,其中一些可能有助于改善数据科学家的活动。

本文将讨论 GPT Store 中的 7 个 GPT,它们可以改善您的数据科学工作流程。这些 GPT 是什么?让我们开始吧。

作为旁注,我会使用 来自 Kaggle 的电信流失数据集 作为 GPT 使用的示例数据集。

让我们从 ChatGPT 团队为我们创建的内容开始, 数据分析师。这是自定义 GPT,经过明确训练来分析我们的数据并根据需要将其可视化。通过删除文件(例如 CSV 文件)并提供我们需要的提示,数据分析师 GPT 可以自动完成这项工作。

例如,我要求数据分析师根据我提供给他们的数据集开发流失相关性分析。 

 

帮助改进数据科学工作流程的 7 个 GPT
数据分析师执行相关性分析(作者图片)
 

您可以向数据分析师 GPT 请求进一步分析。如果需要,您还可以使用 GPT 提供完整的代码以供自己执行。

我们将讨论的下一个 GPT 是 机器学习 GPT。此定制 GPT 旨在作为任何机器学习和数据科学活动的助手。有用性包括讨论、学习和开发适合我们数据项目的算法。

举个例子,我要求机器学习 GPT 从我们的示例数据集中执行模型开发来预测流失率。这是结果。

 

帮助改进数据科学工作流程的 7 个 GPT
机器学习执行模型实验(作者图片)
 

GPT 可以提供他们使用的模型之间的很好的比较。如果继续,我们可以要求模型迭代更多模型,执行超参数调整,并要求 GPT 提供每个操作的原因。

与之前的条目类似, 机器学习工程师 GPT 为用户开发机器学习模型提供助手。您可以放置​​您的数据集并要求 GPT 为您提供必要的步骤和完整的代码。

机器学习工程师的不同之处在于,他们的 GPT 指定了用于自动化复杂任务的模型设计,尤其是部署模型。 GPT 非常适合您讨论如何构建模型以及生产中的模型部署方式。

说到模型结构化,GPT 也适合帮助我们构建机器学习建模的代码。我发现的最好的编码助手之一是 自动专家。它是一个 GPT,旨在帮助您成为坚定的结对程序员助手。

GPT 具有额外的代码生成功能、在线访问最新 API 以及用于保存会话状态的自定义命令,以便您可以在以后的会话中根据需要使用这些状态。

使用此 GPT 将帮助您生成用于数据科学活动期间所需的任何目的的复杂代码。它还为您提供代码结构和脚本,以帮助您更好地执行它们。

让我们从技术编码部分转向理论编码部分。众所周知,数据科学工作是关于持续学习的,尤其是在新的用例中。随着数据科学研究的不断发展,有时很难找到可以帮助我们的用例的完美研究。这是哪里 学者GPT 用武之地。

该 GPT 将帮助您找到适合我们用例的最新研究论文。从简单的提示中,它会为我们提供与我们想要解决的问题相关的最新论文的选择。

例如,下面的文本是 ScholarGPT 的结果,我在那里上传了我们的数据集,我要求他们为我提供一篇与预测流失相关的研究论文。

标题:“决策的透明度:可解释人工智能 (XAI) 在客户流失分析中的作用”

  • 作者:C·厄兹库特
  • 年份:2024
  • 摘要:本研究的重点是使用机器学习来预测客户流失并解释其背后的原因,特别是通过严格的分析来审查电信行业的客户流失情况。
  • 链接: 阅读论文?来源?。

ScholarGPT 提供了更多研究论文供您选择,因此您可以选择适合您的用例的论文。

我们要讨论的下一个 GPT 是 异想天开的图。对于许多数据科学活动来说,并不总是与研究和模型开发有关。很多时候,我们需要可视化我们的工作流程并解释我们的工作方式。这就是异想天开的图表 GPT 可以帮助您的地方。

该 GPT 旨在通过流程图、思维导图和序列图来解释和可视化概念。提供我们所拥有的提示和数据源可以帮助我们提供有助于我们工作的可视化。

例如,我要求模型为我提供流失数据集中的建议图,它建议通过特征可视化流失。下面是图像结果。

 

帮助改进数据科学工作流程的 7 个 GPT
由功能引起的流失(图像由 Whimsical Diagram GPT 生成)
 

您可以与 GPT 进一步讨论,找到适合数据科学工作的完美图表工作流程。

最后一个是 画布 GPT,这可以帮助我们协助传达我们的结果。众所周知,Canva 是一个服务平台,可以帮助设计从徽标到个人资料照片、横幅和演示文稿的所有内容。借助 Canva GPT,他们可以帮助我们获得最佳的分析设计。

数据科学就是将我们的结果传达给其他人,因此以观众能够理解的方式呈现有效的结果至关重要。借助 Canva GPT,我们可以就适合的设计征求建议。例如,我要求模型为我提供一个非常适合展示流失统计数据的设计。

 

帮助改进数据科学工作流程的 7 个 GPT
流失统计设计选择 (Canva GPT)
 

GPT 将为我们提供设计选项,我们可以选择我们喜欢的设计,或者给出额外的提示以获得其他设计。

本文讨论了 GPT 商店中可用的七个自定义 GPT,它们可以改善我们的数据科学工作流程;他们是:

  1. ChatGPT 的数据分析师
  2. 机器学习 作者:Maryam Eskandari
  3. Hustle Playground 的机器学习工程师
  4. AutoExpert(开发)作者:llmimagineers.com
  5. ScholarGPT,作者:awesomegpts.ai
  6. 异想天开的图表,作者:whimsical.com
  7. Canva 由 canva.com 提供

我希望它有帮助!您有任何应该列入此列表的 GPT 建议吗?也请在评论中给出它们。
 
 

科尼利厄斯·尤达·维贾亚 是一名数据科学助理经理和数据作家。 在 Allianz Indonesia 全职工作期间,他喜欢通过社交媒体和写作媒体分享 Python 和数据技巧。

时间戳记:

更多来自 掘金队